Servicios de middleware: mapeo de datos y transformación

Esta figura muestra un entorno en el cual los datos se extrae a partir de tres fuentes de datos diferentes para su inclusión en un almacén de datos, y cada una de las tres fuentes es en una plataforma diferente. En algún momento del proceso de middleware, estos extractos QA'd deben ser llevados juntos por un proceso de mapeo y transformación combinada.

imagen0.jpg

El servicio de mapas y transformación ocupa de los problemas de almacenamiento de datos clásicos. Supongamos que una fuente de datos almacena los clientes mediante el uso de un ID de cliente de cinco caracteres, y otro de origen utiliza un identificador de cliente numérico de seis dígitos.

Para permitir comparaciones y otros procesos de almacenamiento de datos, se necesita un método común de identificación de los clientes: Uno de los esquemas de identificación se debe convertir a la otra, o tal vez un tercer sistema, la identificación neutral, dependiendo de las características del entorno.

Además de manejar incompatibilidades entre sistemas, transformaciones adicionales podrían incluir

  • Resumen de datos: Un resumen se puede realizar antes en el proceso, antes de que el movimiento entre sistemas, en función de las peculiaridades de su entorno específico de almacenamiento de datos.

  • Inclusión selectiva de los datos: Usted puede incluir registros de una sola fuente de datos, por ejemplo, si se obtiene un registro comparable de otro extracto. Usted no sabe, hasta que convergen todas las contribuciones de la fuente de datos, cómo se aplican las reglas de inclusión selectiva.

  • Convergencia de datos: Ciertos elementos de una fuente de datos se combinan con elementos de otra fuente para crear un registro unificado para cada cliente, producto, contrato, o cualquier tipo de datos que se está tratando.

El punto principal a recordar sobre el servicio de mapeo y la transformación es que usted debe tener, a su conclusión, un conjunto unificado de datos que está listo para cargar en el almacén de datos - tan pronto como se complete unos pasos más.

En los entornos de almacenamiento de datos complejos, es posible que desee considerar la posibilidad de múltiples procesos de transformación. Como se muestra en esta figura, por ejemplo, extractos de datos convergen en varios niveles diferentes de transformación antes de mover más abajo en la tubería de middleware, lo que permite aplicar más potencia al proceso de transformación mediante el uso de varios servidores temprano en el flujo.

image1.jpg


» » » » Servicios de middleware: mapeo de datos y transformación