La minería de datos

La característica distintiva sobre la minería de datos, en comparación con las consultas, informes, o incluso OLAP, es que se puede obtener información sin tener que hacer preguntas específicas.

La minería de datos cumple dos funciones principales en su misión de inteligencia de negocios:

  • los " Dime lo que podría suceder " papel: El primer papel de la minería de datos es predictivo, en la que básicamente dice, " Dime lo que podría suceder con el nº 148.; Utilizando el conocimiento oculto encerrado en su almacén de datos, probabilidades y la probabilidad de las tendencias y acontecimientos futuros se descubrían y presentado a usted.

  • los " Dime algo interesante " papel: Además de los posibles eventos y sucesos futuros, la minería de datos también intenta sacar información interesante que probablemente debería saber acerca de, por ejemplo, una relación particularmente inusual entre las ventas de dos productos diferentes y cómo esa relación varía en función de la colocación en sus tiendas al por menor.

    Aunque muchos de estos datos interesantes es probable que existan, ¿qué preguntas le pregunte si estuviera usando una consulta o una herramienta OLAP, y ¿cómo interpretar los resultados? La minería de datos le ayuda en esta ardua tarea de averiguar qué preguntas hacer por hacer gran parte del trabajo duro para usted.

La minería de datos en las misiones específicas de negocio

La minería de datos es particularmente adecuado para estos tipos específicos de misiones empresariales:

  • La detección de fraude

  • La determinación de la eficacia del programa de marketing

  • Selección de los cuales, a partir de una gran base de clientes o la población en general, se debe orientar como parte de un programa de marketing

  • Gestión del ciclo de vida del cliente, incluyendo la misión de retención de clientes

  • Realización de avanzada de modelado de procesos de negocio y escenarios hipotéticos

Piense en lo que hay detrás de cada una de las misiones de negocios en la lista anterior:

  • Una gran cantidad de datos

  • Un número aún mayor de combinaciones de varias piezas de datos

  • Análisis de los resultados de conjunto intensivo, por lo general involucra complejos algoritmos y técnicas estadísticas avanzadas

Ahora, piensa en lo que tendría que hacer si estuviera usando un reporte o una herramienta OLAP para realizar estas misiones. Te resultará prácticamente imposible de realizar a fondo ninguna de las misiones anteriores si tuviera que hacer una pregunta y obtener un resultado, hacer otra pregunta y obtener otro resultado, y luego seguir repitiendo estos pasos.

La minería de datos y la inteligencia artificial

Si usted ha estado en el campo de la tecnología de la información (TI) durante al menos una década, algunos de los términos anteriores puede sonar vagamente familiar. Desbloqueo de conocimiento oculto? Funcionalidad predictivo? Espera un minuto - que es la inteligencia artificial!

Desde los primeros días de la computación comercial, ha habido un gran interés en el desarrollo de " máquinas pensantes " que puede procesar grandes cantidades de datos y tomar decisiones sobre la base de ese análisis.

El interés en la inteligencia artificial (IA) alcanzó su cenit a mediados de la década de 1980. En ese momento, los proveedores de bases de datos trabajaron en la producción de sistemas de gestión de base de conocimientos (KBMSs) - otros vendedores salieron con conchas de sistemas expertos, o marcos de desarrollo de aplicaciones basadas en IA que utilizan técnicas como hacia adelante y hacia atrás en cadena en cadena para asesorar a los usuarios sobre las redes de decisiones- y neuronales fueron posicionados como el próximo gran desarrollo AI.

El interés en la AI se desvaneció a principios de 1990, cuando las expectativas superaron las capacidades disponibles y otros delirios, como cliente / servidor y la migración (por supuesto) el almacenamiento de datos, tomaron el centro del escenario.

Ahora, la IA está de vuelta!

La técnica de IA de más alto perfil utilizado en la minería de datos es redes neuronales. Redes neuronales se concibieron originalmente como un modelo de procesamiento que imitar la forma en que el cerebro humano resuelve problemas, el uso de las neuronas y de procesamiento altamente paralela a hacer la solución patrón.

La aplicación de algoritmos de redes neuronales para las áreas de inteligencia de negocios que las manijas de minería de datos (de nuevo, predictivo y " dime algo interesante " misiones) parece ser una coincidencia natural.

Aunque la minería de datos / juego de la red neuronal es, sin duda vale la pena mirar en, usted debe hacerlo con cuidado. Usted puede encontrar una gran cantidad de tecnologías interesantes y emocionantes que, en manos de aquellos que no entienden los algoritmos, es probable que fallen.

Sin embargo, con el conocimiento y la educación adecuada, se puede hacer un compromiso a gran escala para llevar este tipo de transformación en su marco de inteligencia empresarial como el emparejamiento técnico-análisis para el análisis empresarial OLAP centrada.

La minería de datos y estadísticas

El área más madura de la minería de datos es la aplicación de técnicas estadísticas avanzadas contra los grandes volúmenes de datos en el almacén de datos. Diferentes herramientas utilizan diferentes tipos de técnicas estadísticas, adaptados a las áreas particulares que están tratando de resolver.

Sin un fondo estadístico, es posible encontrar gran parte de la minería de datos confusos. Que tiene que hacer un montón de trabajo para capacitar a los algoritmos y construir las reglas para asegurar resultados adecuados con grandes conjuntos de datos. Sin embargo, en el supuesto de que usted se sienta cómodo con este concepto, o tener un colega que puede ayudar, aquí están algunos de los algoritmos más ampliamente apalancada:

  • Algoritmos de clasificación: Predecir una o más variables discretas, basadas en los otros atributos del conjunto de datos. Mediante el uso de algoritmos de clasificación, la herramienta de minería de datos puede mirar a grandes cantidades de datos y luego informarle que, por ejemplo, " Los clientes que se conservan a través de al menos dos generaciones de las compras de productos tienden a tener estas características: tienen un ingreso de al menos $ 75.000, y ellos son dueños de sus propias casas ".

  • Algoritmos de regresión: Predecir una o más variables continuas, tales como cambios en resultados, basados ​​en otros atributos del conjunto de datos. Algoritmos de regresión son conducidos a través de la información histórica presentada a la herramienta de minería de datos " con el tiempo, " mejor conocido como series de tiempo información.

  • Algoritmos de segmentación: Divida los datos en grupos, o racimos, de los elementos que tienen propiedades similares.

  • Algoritmos Asociación: Encuentra las correlaciones entre los diferentes atributos en un conjunto de datos. La aplicación más común de este tipo de algoritmo crea reglas de asociación, que se pueden utilizar en un análisis de la cesta de mercado. Tenga en cuenta que, por ejemplo, si un cliente compra un paquete de software en particular, él o ella tiene una posibilidad de 65 por ciento de la compra de al menos dos productos específicos paquetes adicionales dentro de dos semanas.

  • Algoritmos de análisis de secuencia: Resumir secuencias frecuentes o episodios de datos, tales como un flujo-path web.

Existen muchos más métodos. Polvo de ese libro estadísticas viejos y empezar a leer.