Bases de datos y minería de datos
Los datos recogidos por las grandes organizaciones en el curso de los negocios todos los días por lo general se almacenan en bases de datos. Pero los administradores de bases de datos pueden no estar dispuestos a permitir que los mineros de datos de acceso directo a estas fuentes de datos, y acceso directo puede no ser la mejor opción desde el punto de vista tampoco. Acceso directo a operativos (utilizado para las operaciones comerciales de rutina) bases de datos puede ser una mala idea porque
Los analistas de datos utilizan una gran cantidad de datos. Usted podría sin querer atar recursos e interferir con las operaciones comerciales normales.
Legales y otras obligaciones empresariales importantes. Usted podría involuntariamente violar una ley de protección de datos u otro requisito de gestión de datos si su acceso a los datos no se controla adecuadamente.
Bases de datos operacionales no están organizados para la minería de datos. Usted podría pasar mucho tiempo luchando para obtener los datos que necesita, y todavía no estar seguro de hacerlo bien.
Cuando usted necesita los datos de una base de datos operativa (y usted tiene la aprobación apropiado utilizar los datos), usted debe discutir sus necesidades con el administrador responsable de esos datos. Tendrá que explicar exactamente lo que los datos que necesita, el formato que usted necesita para la minería de datos, y si es necesario los datos una sola vez o de forma continua.
El mejor enfoque para las solicitudes de una sola vez es a menudo para el administrador para extraer los datos para usted y entregarlo en un archivo de texto u otro formato aceptable.
Acceso a los datos en curso es otro asunto. El administrador puede no querer proporcionar extractos de datos una y otra vez, y que le da acceso directo a los sistemas de negocio es arriesgado. Una solución común es crear una base de datos analítica. Esta es una base de datos relacional ordinaria que es independiente de los sistemas de negocio convencionales. Los datos son rutinariamente (y automáticamente) transferidos de los sistemas de negocio de la base de datos analítica, y la minería de datos puede acceder a él en cualquier momento.
Si utiliza una base de datos analítica, asegúrese de que está organizada adecuadamente para apoyar la minería de datos. Ayude a su administrador de la base por dibujar un diagrama como el que se muestra para demostrar cómo se deben organizar los datos.
Si el administrador de la base insiste en que los datos no se pueden almacenar de esta manera, preguntar si es posible crear un vista (una consulta almacenada que se puede consultar como si fuera una tabla de datos convencional) con la organización que usted necesita.
Muchos productos de minería de datos son capaces de leer los datos de las bases de datos. Los pasos necesarios varían en función de la
Diseño de la aplicación de minería de datos
Estructura de la base de datos fuente
Middleware, generalmente llamado conductor (Controlador ODBC, controlador JDBC), Un software especial que media entre el software de base de datos y aplicaciones
Documentación de la aplicación de minería de datos debe decirle si puede leer los datos de una base de datos, y si es así, ¿qué herramienta o funcionar de usar, y cómo. El administrador que establece la base de datos de análisis puede proporcionar detalles sobre el acceso a la base de datos.
Si ya está cómodo trabajando con bases de datos y otras aplicaciones, encontrarás nada sorprendente acerca de hacer las mismas cosas con una aplicación de minería de datos. Si las bases de datos son nuevos para usted, obtener una persona conocedora de su organización a caminar a través del proceso con su propia aplicación de base de datos y minería de datos.