Big data y persistencia políglota

El término políglota es prestado y redefinió para grandes datos como un conjunto de aplicaciones que utilizan varias tecnologías de base de datos central, y este es el resultado más probable de la planificación de su implementación. La definición oficial de polígloto es "una persona que habla o escribe varios idiomas." Va a ser difícil elegir un estilo de persistencia no importa cómo estrechar su acercamiento a los grandes datos podría ser.

Una base de datos persistencia políglota se utiliza cuando es necesario resolver un problema complejo al romper ese problema en segmentos y aplicando diferentes modelos de base de datos. A continuación, es necesario agregar los resultados en un almacenamiento de datos híbridos y la solución de análisis. Un número de factores afectan esta decisión:

  • Usted ya está utilizando la persistencia políglota en su lugar de trabajo existente. Si su empresa u organización es grande, probablemente se está utilizando RDBMS múltiple, data warehouses, data marts, archivos planos, servidores de gestión de contenidos, y así sucesivamente.

    Este entorno híbrido es común, y hay que entender que para que pueda tomar las decisiones correctas acerca de la integración, el análisis, la puntualidad de los datos, visibilidad de los datos, y así sucesivamente. Es necesario comprender todo eso porque hay que encontrar la manera que va a encajar en su aplicación de datos grande.

  • El más ideal de los ambientes, donde usted tiene sólo una tecnología de persistencia, es probable que no convenía a gran resolución de problemas de datos. Por lo menos, usted tendrá que introducir otro estilo de otras tecnologías de soporte de base de datos y para su nueva aplicación.

  • Dependiendo de la variedad y la velocidad de la recopilación de datos grande, puede que tenga que considerar diferentes bases de datos para apoyar una implementación. También debe considerar sus necesidades de integridad transaccional. ¿Es necesario para apoyar el cumplimiento de ACID o voluntad cumplimiento BASE ser suficiente?

Supongamos que usted necesita para identificar a todos los clientes para su producto que han adquirido en los últimos 12 meses y han comentado en los sitios web sociales acerca de su experiencia - Y si han tenido casos de apoyo, donde adquirieron el producto, la forma en que fue entregado, lo que pagaron, cómo se paga, si han estado en el sitio web de la empresa, el número de veces, lo que hicieron, y así sucesivamente.

Entonces supongamos que desea ofrecerles un descuento promocional de su teléfono inteligente cuando están entrando en una de su (o uno de sus socios) tiendas al por menor.

Este es un desafío de datos grande en su mejor momento. Múltiples fuentes de datos con estructuras muy diferentes tienen que ser recogido y analizado para que pueda obtener las respuestas a estas preguntas. Luego hay que determinar si los clientes califican para la promoción y, en tiempo real, los empujan un cupón ofreciéndoles algo nuevo e interesante.

Este tipo de problema no se puede resolver fácilmente o rentable con un tipo de tecnología de base de datos. A pesar de que parte de la información básica es transaccional y probablemente en un RDBMS, la otra información es relacional y requerirá al menos dos tipos de motores de persistencia (espacial y gráfico). Ahora tiene persistencia políglota.




» » » » Big data y persistencia políglota