Servicios de integración de la información de la empresa
Alrededor de 1995, los vendedores comenzaron a posicionar su software como herramientas de almacenamiento de datos virtuales. La premisa fundamental era que a veces simplemente no tiene sentido copiar y manipular un montón de datos, por si acaso alguien lo necesita. ¿Por qué no acceder a los datos directamente de la fuente en una función de las necesidades?
Por desgracia, el acceso a datos a través de una red en su origen ha demostrado ser el menos exigente de los problemas al tratar de proporcionar una especie de en el lugar de almacenamiento de datos. Los mismos desafíos que enfrentan en cualquier entorno de almacenamiento de datos (por ejemplo, se trata de calidad de los datos, decidir qué tipos de transformaciones debe ocurrir, y la elección de cómo manejar esas transformaciones cuando diferentes fuentes son incompatibles) todavía están presentes.
El hecho de que se puede llegar a los datos en su fuente (en casi cualquier estructura de base de datos o archivo), no significa que los datos proporciona la inteligencia empresarial necesaria cuando está en tus manos.
Para resolver estos problemas de calidad de datos, arquitectos muchos datos han comenzado a llevar a cabo la construcción data mart de abajo hacia arriba para desarrollar un almacén de datos basado en componentes. En lugar de tener una sola base de datos en la que usted alimenta a todos los datos (creación de su almacén de datos), una serie de componentes de cada uno se ocupa de un determinado conjunto de funciones (tales como contestar preguntas específicas de negocio) o ciertos temas. Juntos, estos mercados de datos (o componentes) comprenden un entorno de almacenamiento de datos.
Esta dinámica arquitectura de datos de acceso basado en componentes es la base para el almacenamiento de datos virtual y, más específicamente, ¿qué Integración de Información Empresarial (EII) servidores están ofreciendo al mercado.
Esta figura muestra un entorno en el que los componentes individuales se crean dentro del entorno de almacenamiento de datos de manera ascendente. En lugar de la combinación de los componentes en una gran base de datos (y la copia de todos los datos de nuevo), EII crea un entorno de almacenamiento de datos en la que los usuarios pueden acceder a los contenidos de cada componente de una herramienta de inteligencia de negocio como todos fueron almacenados juntos, a pesar de que no lo son .
Piense en cómo se utiliza un navegador web en el escritorio. Usted tampoco clic en un vínculo o escribe una dirección URL específica, y el medio ambiente, trabajando detrás de la escena, te lleva al lugar indicado por el contenido que usted pidió. Ahora, imagine Internet correr mucho más rápido.
Cuando vayas a varios sitios, no se está accediendo anuncios para las últimas cuatro ruedas motrices que has estado codiciado, resultados deportivos, caricaturas de Dilbert, o cualquier otra cosa que sea que hagas en Internet. Usted está trayendo de vuelta las piezas de datos que luego se combinan y se envían de vuelta a su navegador. Eso es el almacenamiento de datos virtual - es igual que el Internet!
No es una buena idea para construir un entorno de almacenamiento de datos virtual para acceder a los datos de origen directamente, en su formato nativo. Su reto no es encontrar la manera de unirse a las bases de datos multiplataforma (combinando datos IMS con datos de DB2, por ejemplo) y el manejo de ese tipo de transformación a nivel de sistema, se garantiza que la calidad de los datos es alta y no requiere el usuario para limpiar manualmente los datos.
Por tanto, cada aplicación debe ser almacén habilitado y contienen un proveedor de datos que es responsable de todos los servicios de middleware (como la extracción y el aseguramiento de la calidad), como se especifica en las reglas de negocio del medio ambiente.
El proveedor de datos podría operar concebiblemente casi en modo de tiempo real, como tendría que hacerlo en un almacén de datos operacionales, o podría funcionar en un modo periódico (orientado a lotes) si no se requieren actualizaciones instantáneas. En esta situación, el editor de datos es un producto mini-middleware incrustado en la aplicación (o un servicio visitada por la aplicación).
Cuando usted piensa en el almacenamiento de datos virtual, sustituya la pregunta "? ¿Puedo llegar a los datos " con la pregunta "? ¿Puedo llegar a datos utilizables " El proveedor de datos juega un papel importante, y no debe ser descuidado.
También no puede arquitectura de datos negligencia. El hecho de que usted está desarrollando componentes de manera ascendente y que está siendo visitada en su lugar, en lugar de ser copiado en una base de datos de almacenamiento de datos más grande, no significa que usted puede descuidar esta función.
Decir que los ID de las tiendas de un componente cliente como números de cinco dígitos después de que ocurra la transformación y contiene sólo los clientes que hicieron compras en los últimos seis meses. Y otro componente, que contiene todos los clientes que nunca han comprado productos de su empresa, utiliza siete caracteres identificadores alfanuméricos. En esta situación, es posible que tenga el mismo tipo de problemas de desajuste datos que usted haría si estuviera accediendo a los datos directamente de las fuentes.
Aunque EII permite diferencias entre el contenido de componentes, es necesario comprender y gestionar las diferencias para que no obstaculicen la misión de inteligencia de negocios.