Big data y persistencia políglota

El término políglota es prestado y redefinió para grandes datos como un conjunto de aplicaciones que utilizan varias tecnologías de base de datos central, y este es el resultado más probable de la planificación de su implementación. La definición oficial de polígloto es "una persona que habla o escribe varios idiomas." Va a ser difícil elegir un estilo de persistencia no importa cómo estrechar su acercamiento a los grandes datos podría ser.

Una base de datos persistencia políglota se utiliza cuando es necesario resolver un problema complejo al romper ese problema en segmentos y aplicando diferentes modelos de base de datos. A continuación, es necesario agregar los resultados en un almacenamiento de datos híbridos y la solución de análisis. Un número de factores afectan esta decisión:

Usted ya está utilizando la persistencia políglota en su lugar de trabajo existente. Si su empresa u organización es grande, probablemente se está utilizando RDBMS múltiple, data warehouses, data marts, archivos planos, servidores de gestión de contenidos, y así sucesivamente.
Este entorno híbrido es común, y hay que entender que para que pueda tomar las decisiones correctas acerca de la integración, el análisis, la puntualidad de los datos, visibilidad de los datos, y así sucesivamente. Es necesario comprender todo eso porque hay que encontrar la manera que va a encajar en su aplicación de datos grande.
El más ideal de los ambientes, donde usted tiene sólo una tecnología de persistencia, es probable que no convenía a gran resolución de problemas de datos. Por lo menos, usted tendrá que introducir otro estilo de otras tecnologías de soporte de base de datos y para su nueva aplicación.
Dependiendo de la variedad y la velocidad de la recopilación de datos grande, puede que tenga que considerar diferentes bases de datos para apoyar una implementación. También debe considerar sus necesidades de integridad transaccional. ¿Es necesario para apoyar el cumplimiento de ACID o voluntad cumplimiento BASE ser suficiente?

Supongamos que usted necesita para identificar a todos los clientes para su producto que han adquirido en los últimos 12 meses y han comentado en los sitios web sociales acerca de su experiencia - Y si han tenido casos de apoyo, donde adquirieron el producto, la forma en que fue entregado, lo que pagaron, cómo se paga, si han estado en el sitio web de la empresa, el número de veces, lo que hicieron, y así sucesivamente.

Entonces supongamos que desea ofrecerles un descuento promocional de su teléfono inteligente cuando están entrando en una de su (o uno de sus socios) tiendas al por menor.

Este es un desafío de datos grande en su mejor momento. Múltiples fuentes de datos con estructuras muy diferentes tienen que ser recogido y analizado para que pueda obtener las respuestas a estas preguntas. Luego hay que determinar si los clientes califican para la promoción y, en tiempo real, los empujan un cupón ofreciéndoles algo nuevo e interesante.

Este tipo de problema no se puede resolver fácilmente o rentable con un tipo de tecnología de base de datos. A pesar de que parte de la información básica es transaccional y probablemente en un RDBMS, la otra información es relacional y requerirá al menos dos tipos de motores de persistencia (espacial y gráfico). Ahora tiene persistencia políglota.

Sobre el autor

Capa 3 de la pila de datos grande: la organización de los servicios y herramientas de datos

La organización de los servicios de datos y herramientas, la capa 3 de la pila de datos grande, capturar, validar, y montar varios elementos de datos grandes en colecciones contextualmente relevantes. Dado que los datos de grande es masiva, las…

Bases de datos multidimensionales

Esta no es la primera vez en la historia reciente que han surgido y superar las ineficiencias RDBMS nuevos tipos de productos de base de datos. De vuelta en la década de 1980, se identificó una clase de aplicaciones en las que RDBMS productos…

Las bases de datos no relacionales en un entorno de datos grande

Las bases de datos no relacionales no se basan en la tabla / modelo clave endémica de RDBMS (sistemas de gestión de base de datos relacional). En resumen, los datos de la especialidad en el gran mundo de los datos requiere persistencia…

RDBMS en un entorno de datos grande

Gran datos se está convirtiendo en un elemento importante en la forma en las organizaciones están aprovechando de datos de gran volumen a la velocidad adecuada para resolver los problemas específicos de datos. Sistemas de Gestión de Bases de…

Productos relacionales y almacenamiento de datos

Aquí están algunos de los principales productos de bases de datos relacionales que es posible que desee utilizar para el almacenamiento de datos. Casi todos estos proveedores han, durante los últimos años, adquirió productos adicionales,…

Los datos estructurados en un entorno de datos grande

El termino datos estructurados generalmente se refiere a los datos que tiene una longitud definida y el formato de datos grandes. Ejemplos de datos estructurados incluyen números, fechas y grupos de palabras y números de llamadas cuerdas. La…

La evolución de los modelos de despliegue en la era de los grandes datos

Con la llegada de grandes volúmenes de datos, los modelos de implementación para la gestión de datos están cambiando. El almacén de datos tradicional se lleva a cabo normalmente en un solo sistema, grande dentro del centro de datos. Los costes…

Los fundamentos de la gran integración de datos

Los elementos fundamentales de la plataforma de datos grande gestionar los datos de nuevas maneras, en comparación con la base de datos relacional tradicional. Esto es debido a la necesidad de contar con la escalabilidad y alto rendimiento…

El futuro de los almacenes de datos en la era de los grandes datos

El mercado de almacenamiento de datos de hecho ha empezado a cambiar y evolucionar con la llegada de grandes datos. En el pasado, simplemente no era económico para las empresas a almacenar la cantidad masiva de datos de un gran número de sistemas…

Gestión de datos empresariales y datos grandes

Gestión de datos empresariales (EDM) es un proceso importante en las grandes datos para la comprensión y el control de la economía de los datos en su empresa u organización. Aunque EDM no es necesaria para los grandes datos, la correcta…

Cómo incorporar datos grandes en el diagnóstico de enfermedades

En todo el mundo, las fuentes de datos grandes para la salud están siendo creados y puestos a disposición para su integración en los procesos existentes. Los datos clínicos de los ensayos, la genética y los datos de mutaciones genéticas, los…

Sentar las bases para su estrategia de datos grande

Las empresas están nadando en grandes volúmenes de datos. El problema es que a menudo no saben cómo utilizar pragmáticamente que los datos sean capaces de predecir el futuro, ejecutar procesos de negocios importantes, o simplemente obtener…

maniqui-es.com » Computadoras y software » Big Data » Ingeniería » Big data y persistencia políglota