La modernización del almacén de datos con Hadoop
Los almacenes de datos están ahora bajo estrés, tratando de hacer frente a la mayor demanda de sus recursos finitos. Hadoop puede proporcionar un alivio significativo en esta situación de almacenamiento de datos.
El rápido aumento de la cantidad de datos que se generan en el mundo tiene también los almacenes de datos afectados porque los volúmenes de datos que manejamos están aumentando - en parte porque más estructurado datos, el tipo de datos que es fuertemente tipado y embutidas en filas y columnas - se genera sino también porque a menudo tienen que lidiar con los requisitos reglamentarios diseñados para mantener consultable acceso a los datos históricos.
Además, la potencia de procesamiento en los almacenes de datos se utiliza a menudo para llevar a cabo transformaciones de los datos relacionales, ya que o bien entra en el propio almacén o se carga en un data mart niño (un subconjunto separado del almacén de datos) para una aplicación de análisis específico.
Además, la necesidad es cada vez mayor para los analistas de emitir nuevas consultas en los datos estructurados almacenados en bodegas, y estas consultas ad hoc a menudo puede utilizar importantes recursos de procesamiento de datos. A veces, un informe de una sola vez puede ser suficiente, ya veces un análisis exploratorio es necesario encontrar las preguntas que no han sido hechas hasta ahora de que puede producir un importante valor empresarial.
La conclusión es que los almacenes de datos a menudo se utilizan para fines ajenos a su diseño original.
Muestra la figura, utilizando arquitectura de alto nivel, ¿cómo Hadoop puede vivir junto a los almacenes de datos y cumplir con algunos de los efectos que no están diseñados para.
Hadoop es un almacén ayudante, no un reemplazo almacén. Hadoop puede modernizar un ecosistema de almacenamiento de datos de cada cuatro formas- aquí son en resumen:
Proporcionar una zona de aterrizaje para todos los datos.
Persisten los datos para proporcionar un archivo consultable de los datos fríos.
La eficiencia de procesamiento por lotes a gran escala Apalancamiento de Hadoop a preproceso y transformar los datos para el almacén.
Habilitar un entorno para el descubrimiento hoc ad datos.