Middleware para el almacenamiento de datos

Middleware es un software informático que conecta los componentes de software. En un entorno de almacenamiento de datos, los servicios de middleware son el conjunto de programas y rutinas que hacen lo siguiente:

  • Extraer datos de la fuente (o fuentes).

  • Asegúrese de que correcta de los datos.

  • Mueva los datos de todo el entorno de plataforma en plataforma, según sea necesario.

  • Manejar las transformaciones de datos necesarios.

  • Cargar los datos en la base de datos del almacén de datos (o bases de datos).

En un sentido más formal, los elementos de la lista anterior son manejados por estos servicios de middleware:

  • Selección y extracción de datos

  • Aseguramiento de la calidad de datos, parte I (a nivel de componentes)

  • El movimiento de datos, parte I (también a nivel de componentes)

  • Mapeo y transformación de datos

  • Aseguramiento de la calidad de datos, parte II (después de haberse producido la transformación)

  • El movimiento de datos, parte II (en el entorno de la plataforma del almacén de datos)

  • Carga de datos (en el almacén de datos)

Esta figura ilustra cómo estos servicios middleware confluyen en un entorno de almacenamiento de datos de tamaño moderado.

imagen0.jpg

Pero su entorno de almacenamiento de datos puede ser diferente del que se muestra en esta figura, particularmente en el área de los servicios de datos en movimiento. Un servicio de datos en movimiento es necesario cada vez que los límites del sistema cruces de datos. Su cuadro conceptual diferente, dependiendo de los detalles de su entorno particular de extremo a extremo.

Usted absolutamente, positivamente tiene que planificar, diseñar, y de otra manera pensar en almacén middleware datos en términos de los servicios individuales en la lista anterior, más que en términos genéricos, tales como " herramientas de extracción ". Muchos proveedores diferentes proporcionan algunos, muchos, o todos estos servicios como parte de un solo producto o un conjunto de productos.

Sin embargo, una herramienta que tiene fuertes servicios de cartografía y de transformación, por ejemplo, podría ser débil en los servicios de carga de datos, o una herramienta que proporciona un amplio conjunto de servicios de extracción podría ser menos eficaz en el espacio de mapeo y transformación, además de la calidad de datos aseguramiento.

Antes de seleccionar una herramienta para su proyecto de almacenamiento de datos (si esa es la ruta que toma, en lugar de la codificación personalizada), asegúrese de que usted tiene una buena idea sobre los retos particulares de su entorno. Si usted tiene necesidades relativamente sencillas de extracción de datos, por ejemplo, pero los problemas de calidad de datos desafiantes, concentrarse en encontrar la mejor herramienta de control de calidad disponible, incluso si tiene sólo regular capacidades de extracción.

(Este consejo se aplica incluso si la herramienta no tiene capacidades de extracción, en cuyo caso, hay que combinarla con otra herramienta.)




» » » » Middleware para el almacenamiento de datos