Servicios de middleware: selección de datos y extracciones
El propósito principal de la selección de datos y el servicio es -extracción seleccionar a partir de (encontrar en) una fuente de datos los datos que desea mover en el almacén de datos y después extracto (sacar) que los datos en una forma que pueda ser preparaba para los servicios de control de calidad.
Usted puede utilizar uno de dos tipos diferentes de servicios de selección y extracción de su entorno de almacenamiento de datos:
Get 'em todo y ordenar ellos más tarde: Buscar y extraer todos los elementos de datos en una fuente que desea cargar en su almacén de datos, independientemente de si un elemento específico se ha extraído previamente.
Cambie orientadas a: Buscar y extraer sólo los elementos de datos que han sido o bien acaba de agregar a la fuente de datos o actualizado desde la última extracción.
El primer tipo de servicio requiere menos lógica compleja con el fin de realizar la extracción. Pero usted tiene que tratar con volúmenes más grandes (a veces, volúmenes mucho más grandes) de datos que con el segundo tipo, el servicio de cambio orientada.
El método de cambio orientado a la selección y extracción es bastante sencillo cuando su origen es una base de datos relacional que tiene una marca de tiempo que puede utilizar para detectar cuando se añadió una fila de datos o de la última actualización.
Usted puede comparar una fila de datos en contra de la fecha y hora de la última proceso de extracción para determinar si los datos debe ser seleccionado y extraído. Pero cuando los datos se almacenan en un archivo que no tenga un sello de tiempo (un archivo VSAM, por ejemplo), este proceso puede ser significativamente más difícil.
También podría enfrentar un desafío cuando los datos fuente ha sido borrado de un archivo o una base de datos. Si las reglas de negocio para su entorno llamada almacenamiento de datos para la supresión de los datos correspondientes de la bodega, que deben tener una forma de detectar supresiones que se hicieron desde el último proceso de extracción para asegurar que las supresiones adecuadas se hacen en su almacén.
El resultado de la selección y extracción es, así, un extracto de los datos que está listo para someterse a un procesamiento adicional: la salida a la calidad de los datos.