La creación de estructuras de datos grandes y manejables

Como la computación se movió en el mercado comercial, los datos se almacenan en archivos planos que impusieron ninguna estructura. Hoy en día, los grandes datos requiere estructuras de datos manejables. Cuando las empresas necesitan para llegar a un nivel de comprensión detallada acerca de los clientes, que tenían que aplicar métodos de fuerza bruta, incluyendo modelos de programación muy detalladas para crear algún valor.

Más tarde, en la década de 1970, las cosas cambiaron con la invención del modelo de datos relacional y el sistema de gestión de bases de datos relacionales (RDBMS) que impuso estructura y un método para mejorar el rendimiento. Lo más importante, el modelo relacional añade un nivel de abstracción para que fuera más fácil para los programadores para satisfacer las crecientes demandas del negocio para extraer valor de los datos.

El modelo relacional ofrece un ecosistema de herramientas de un gran número de empresas de software emergentes. Llenó una creciente necesidad de ayudar a las empresas organizar mejor sus datos y poder comparar las transacciones de una geografía a otra.

Además, ayudó a los gerentes de empresas que querían ser capaces de examinar la información tal como inventario y compararlo con la información de pedidos de clientes para la toma de decisiones. Pero un problema surgido de esta demanda explosiva de respuestas: almacenar este creciente volumen de datos era caro y accediendo era lento. Para empeorar las cosas, un montón de duplicación de datos existían, y el valor de negocio real de que los datos era difícil de medir.

Cuando el volumen de datos que las organizaciones necesitan para gestionar creció fuera de control, el almacén de datos proporciona una solución. El almacén de datos permitió a la organización de TI para seleccionar un subconjunto de los datos que se almacena por lo que sería más fácil para el negocio para tratar de obtener información.

El almacén de datos se pretende ayudar a las empresas hacer frente a cada vez mayores cantidades de datos estructurados que tenían que ser capaces de analizar mediante la reducción del volumen de los datos a algo más pequeño y más centrado en un área particular de la empresa. Se llena la necesidad de separar el procesamiento de apoyo a las decisiones operativas y de soporte de decisiones - por razones de rendimiento.

Almacenes suelen almacenar los datos de años anteriores para entender el desempeño organizacional, identificando tendencias y ayudar a exponer a los patrones de comportamiento. También proporcionó una fuente integrada de la información desde el otro lado varias fuentes de datos que podrían ser utilizados para el análisis. Hoy en día, tanto los sistemas de gestión de contenidos y los almacenes de datos son capaces de tomar ventaja de las mejoras en la escalabilidad de hardware, tecnologías de virtualización y la capacidad de crear sistemas de hardware y software integrados.

A veces estos datos almacenes sí eran demasiado complejas y grandes y no ofrecen la velocidad y la agilidad que requiere el negocio. La respuesta fue un refinamiento adicional de los datos que se gestiona a través de mercados de datos. Estos data marts se centraron en temas de negocios específicos y apoyaron la necesidad de negocio para consultas rápidas. El almacén ha evolucionado para apoyar las nuevas tecnologías, como los sistemas integrados y dispositivos de datos.

Los almacenes de datos y data marts resuelven muchos problemas para las empresas que necesitan una manera consistente para gestionar datos transaccionales masivos. Pero cuando se trataba de la gestión de grandes volúmenes de datos no estructurados o semi-estructurados, el almacén no era capaz de evolucionar lo suficiente para satisfacer las cambiantes demandas.

Para complicar las cosas, los almacenes de datos se alimentan típicamente en intervalos de lotes, por lo general semanal o diaria. Esto está bien para la planificación, la presentación de informes financieros, y las campañas de marketing tradicionales, pero es demasiado lento para cada vez más entornos empresariales y de consumo en tiempo real.

¿Cómo las empresas capaces de transformar sus enfoques de gestión de datos tradicionales para manejar el volumen creciente de elementos de datos no estructurados? La solución no surgió durante la noche. Dado que las empresas comenzaron a almacenar datos no estructurados, los vendedores comenzaron a agregar capacidades tales como BLOB (objetos grandes binarios).

En esencia, un elemento de datos no estructurados se almacena en una base de datos relacional como una porción contigua de datos. Este objeto podría ser etiquetado pero no se podía ver lo que había dentro de ese objeto. Claramente, esto no se va a resolver las necesidades cambiantes de los clientes o de negocios.

Introduzca el sistema de gestión de base de datos objeto (ODBMS). La base de datos de objetos almacena el BLOB como un conjunto direccionable de piezas de manera que se podía ver lo que estaba allí. A diferencia del BLOB, que era una unidad independiente adjunta a una base de datos relacional tradicional, la base de datos de objetos proporciona un enfoque unificado para hacer frente a los datos no estructurados.

Bases de datos de objetos incluyen un lenguaje de programación y una estructura para los elementos de datos de manera que es más fácil de manipular diversos objetos de datos sin necesidad de programación y complejo se une. Las bases de datos de objetos introducen un nuevo nivel de innovación que ayudó a llevar a la segunda ola de la gestión de datos.

Sobre el autor

Información de almacenamiento de datos y multimedia

Cada área de la tecnología está en constante cambio, y el almacenamiento de datos no es una excepción. Debido a que el almacenamiento de datos está al borde de una nueva generación de tecnologías, debe familiarizarse con algunas de las…

Almacén de datos: fuentes de datos fuente

Un almacén de datos es, por su propia naturaleza, un almacén de datos física distribuida. Distribución de sus activos de información ayuda en el rendimiento y la facilidad de uso a través de sistemas y en toda la empresa. Hacer este nivel de…

El almacenamiento de datos: ¿qué es un activo de datos?

LA almacén de datos es una casa para sus datos de alto valor, o los activos de datos, que se origina en otras aplicaciones corporativas, como la que su empresa utiliza para cumplir con los pedidos de los clientes para sus productos, o alguna fuente…

Capa 3 de la pila de datos grande: la organización de los servicios y herramientas de datos

La organización de los servicios de datos y herramientas, la capa 3 de la pila de datos grande, capturar, validar, y montar varios elementos de datos grandes en colecciones contextualmente relevantes. Dado que los datos de grande es masiva, las…

Capa 4 de la pila de datos grande: almacenes de datos analíticos

El almacén de datos, la capa 4 de la pila de datos grande, y su compañero de la despensa de datos, han sido durante mucho tiempo las técnicas primarias que las organizaciones utilizan para optimizar los datos para ayudar a los tomadores de…

Bases de datos multidimensionales

Esta no es la primera vez en la historia reciente que han surgido y superar las ineficiencias RDBMS nuevos tipos de productos de base de datos. De vuelta en la década de 1980, se identificó una clase de aplicaciones en las que RDBMS productos…

Las bases de datos no relacionales en un entorno de datos grande

Las bases de datos no relacionales no se basan en la tabla / modelo clave endémica de RDBMS (sistemas de gestión de base de datos relacional). En resumen, los datos de la especialidad en el gran mundo de los datos requiere persistencia…

La evolución de los modelos de despliegue en la era de los grandes datos

Con la llegada de grandes volúmenes de datos, los modelos de implementación para la gestión de datos están cambiando. El almacén de datos tradicional se lleva a cabo normalmente en un solo sistema, grande dentro del centro de datos. Los costes…

Los fundamentos de la gran integración de datos

Los elementos fundamentales de la plataforma de datos grande gestionar los datos de nuevas maneras, en comparación con la base de datos relacional tradicional. Esto es debido a la necesidad de contar con la escalabilidad y alto rendimiento…

El futuro de los almacenes de datos en la era de los grandes datos

El mercado de almacenamiento de datos de hecho ha empezado a cambiar y evolucionar con la llegada de grandes datos. En el pasado, simplemente no era económico para las empresas a almacenar la cantidad masiva de datos de un gran número de sistemas…

Mejores prácticas para la gran integración de datos

Muchas empresas están explorando problemas de datos grandes y dar con algunas soluciones innovadoras. Ahora es el momento de prestar atención a algunos mejores prácticas, o principios básicos, que serán muy útiles a medida que comienza su…

Gran web de datos y gestión de contenidos

Gran datos requiere un enfoque coherente de web y gestión de contenidos. No es ningún secreto que la mayoría de los datos disponibles en el mundo de hoy no es estructurado. Paradójicamente, las empresas han centrado sus inversiones en los…

maniqui-es.com » Computadoras y software » Big Data » Ingeniería » La creación de estructuras de datos grandes y manejables