La minería de datos

La característica distintiva sobre la minería de datos, en comparación con las consultas, informes, o incluso OLAP, es que se puede obtener información sin tener que hacer preguntas específicas.

Conteúdo

La minería de datos en las misiones específicas de negocio
La minería de datos y la inteligencia artificial
La minería de datos y estadísticas

La minería de datos cumple dos funciones principales en su misión de inteligencia de negocios:

los " Dime lo que podría suceder " papel: El primer papel de la minería de datos es predictivo, en la que básicamente dice, " Dime lo que podría suceder con el nº 148.; Utilizando el conocimiento oculto encerrado en su almacén de datos, probabilidades y la probabilidad de las tendencias y acontecimientos futuros se descubrían y presentado a usted.
los " Dime algo interesante " papel: Además de los posibles eventos y sucesos futuros, la minería de datos también intenta sacar información interesante que probablemente debería saber acerca de, por ejemplo, una relación particularmente inusual entre las ventas de dos productos diferentes y cómo esa relación varía en función de la colocación en sus tiendas al por menor.
Aunque muchos de estos datos interesantes es probable que existan, ¿qué preguntas le pregunte si estuviera usando una consulta o una herramienta OLAP, y ¿cómo interpretar los resultados? La minería de datos le ayuda en esta ardua tarea de averiguar qué preguntas hacer por hacer gran parte del trabajo duro para usted.

La minería de datos en las misiones específicas de negocio

La minería de datos es particularmente adecuado para estos tipos específicos de misiones empresariales:

La detección de fraude
La determinación de la eficacia del programa de marketing
Selección de los cuales, a partir de una gran base de clientes o la población en general, se debe orientar como parte de un programa de marketing
Gestión del ciclo de vida del cliente, incluyendo la misión de retención de clientes
Realización de avanzada de modelado de procesos de negocio y escenarios hipotéticos

Piense en lo que hay detrás de cada una de las misiones de negocios en la lista anterior:

Una gran cantidad de datos
Un número aún mayor de combinaciones de varias piezas de datos
Análisis de los resultados de conjunto intensivo, por lo general involucra complejos algoritmos y técnicas estadísticas avanzadas

Ahora, piensa en lo que tendría que hacer si estuviera usando un reporte o una herramienta OLAP para realizar estas misiones. Te resultará prácticamente imposible de realizar a fondo ninguna de las misiones anteriores si tuviera que hacer una pregunta y obtener un resultado, hacer otra pregunta y obtener otro resultado, y luego seguir repitiendo estos pasos.

La minería de datos y la inteligencia artificial

Si usted ha estado en el campo de la tecnología de la información (TI) durante al menos una década, algunos de los términos anteriores puede sonar vagamente familiar. Desbloqueo de conocimiento oculto? Funcionalidad predictivo? Espera un minuto - que es la inteligencia artificial!

Desde los primeros días de la computación comercial, ha habido un gran interés en el desarrollo de " máquinas pensantes " que puede procesar grandes cantidades de datos y tomar decisiones sobre la base de ese análisis.

El interés en la inteligencia artificial (IA) alcanzó su cenit a mediados de la década de 1980. En ese momento, los proveedores de bases de datos trabajaron en la producción de sistemas de gestión de base de conocimientos (KBMSs) - otros vendedores salieron con conchas de sistemas expertos, o marcos de desarrollo de aplicaciones basadas en IA que utilizan técnicas como hacia adelante y hacia atrás en cadena en cadena para asesorar a los usuarios sobre las redes de decisiones- y neuronales fueron posicionados como el próximo gran desarrollo AI.

El interés en la AI se desvaneció a principios de 1990, cuando las expectativas superaron las capacidades disponibles y otros delirios, como cliente / servidor y la migración (por supuesto) el almacenamiento de datos, tomaron el centro del escenario.

Ahora, la IA está de vuelta!

La técnica de IA de más alto perfil utilizado en la minería de datos es redes neuronales. Redes neuronales se concibieron originalmente como un modelo de procesamiento que imitar la forma en que el cerebro humano resuelve problemas, el uso de las neuronas y de procesamiento altamente paralela a hacer la solución patrón.

La aplicación de algoritmos de redes neuronales para las áreas de inteligencia de negocios que las manijas de minería de datos (de nuevo, predictivo y " dime algo interesante " misiones) parece ser una coincidencia natural.

Aunque la minería de datos / juego de la red neuronal es, sin duda vale la pena mirar en, usted debe hacerlo con cuidado. Usted puede encontrar una gran cantidad de tecnologías interesantes y emocionantes que, en manos de aquellos que no entienden los algoritmos, es probable que fallen.

Sin embargo, con el conocimiento y la educación adecuada, se puede hacer un compromiso a gran escala para llevar este tipo de transformación en su marco de inteligencia empresarial como el emparejamiento técnico-análisis para el análisis empresarial OLAP centrada.

La minería de datos y estadísticas

El área más madura de la minería de datos es la aplicación de técnicas estadísticas avanzadas contra los grandes volúmenes de datos en el almacén de datos. Diferentes herramientas utilizan diferentes tipos de técnicas estadísticas, adaptados a las áreas particulares que están tratando de resolver.

Sin un fondo estadístico, es posible encontrar gran parte de la minería de datos confusos. Que tiene que hacer un montón de trabajo para capacitar a los algoritmos y construir las reglas para asegurar resultados adecuados con grandes conjuntos de datos. Sin embargo, en el supuesto de que usted se sienta cómodo con este concepto, o tener un colega que puede ayudar, aquí están algunos de los algoritmos más ampliamente apalancada:

Algoritmos de clasificación: Predecir una o más variables discretas, basadas en los otros atributos del conjunto de datos. Mediante el uso de algoritmos de clasificación, la herramienta de minería de datos puede mirar a grandes cantidades de datos y luego informarle que, por ejemplo, " Los clientes que se conservan a través de al menos dos generaciones de las compras de productos tienden a tener estas características: tienen un ingreso de al menos $ 75.000, y ellos son dueños de sus propias casas ".
Algoritmos de regresión: Predecir una o más variables continuas, tales como cambios en resultados, basados en otros atributos del conjunto de datos. Algoritmos de regresión son conducidos a través de la información histórica presentada a la herramienta de minería de datos " con el tiempo, " mejor conocido como series de tiempo información.
Algoritmos de segmentación: Divida los datos en grupos, o racimos, de los elementos que tienen propiedades similares.
Algoritmos Asociación: Encuentra las correlaciones entre los diferentes atributos en un conjunto de datos. La aplicación más común de este tipo de algoritmo crea reglas de asociación, que se pueden utilizar en un análisis de la cesta de mercado. Tenga en cuenta que, por ejemplo, si un cliente compra un paquete de software en particular, él o ella tiene una posibilidad de 65 por ciento de la compra de al menos dos productos específicos paquetes adicionales dentro de dos semanas.
Algoritmos de análisis de secuencia: Resumir secuencias frecuentes o episodios de datos, tales como un flujo-path web.

Existen muchos más métodos. Polvo de ese libro estadísticas viejos y empezar a leer.

Sobre el autor

Cómo financiar asociaciones entre los elementos de datos de análisis predictivo

El uso del análisis predictivo como una herramienta de minería de datos también busca descubrir relaciones ocultas entre los elementos de sus datos. Estas relaciones son llamados ocultos reglas de asociación minera.Considere la posibilidad de un…

Cómo preparar los datos para un modelo de análisis predictivo

Cuando haya definido los objetivos del modelo de análisis predictivo, el siguiente paso es identificar y preparar los datos que va a utilizar para construir su modelo. La secuencia general de pasos es la siguiente:Identificar las fuentes de…

Cómo utilizar mahout apache para análisis predictivo

Una herramienta de código abierto que es únicamente útil en el análisis predictivo es Apache Mahout. Esta biblioteca de aprendizaje de máquinas incluye versiones a gran escala de la agrupación, clasificación, filtrado colaborativo y otros…

Minería sus datos utilizando la ciencia de datos

En la era de los grandes datos, parece que las organizaciones de todo tipo y tamaño están en una misión de contratación. Quieren contratar a científicos de datos para que puedan utilizar los datos y la toma de decisiones los datos informados…

La minería de datos para los datos de gran

La minería de datos consiste en explorar y analizar grandes cantidades de datos para encontrar las pautas de los grandes datos. Las técnicas salieron de los campos de la estadística y la inteligencia artificial (IA), con un poco de gestión de…

La minería de datos para el almacenamiento de datos

A veces, la minería de datos para el almacenamiento de datos no se mezcla con las otras formas de inteligencia de negocios. Esta falta de integración se produce por dos razones:Los usuarios de negocios no tienen el conocimiento requerido en bases…

Fuentes de datos y herramientas de inteligencia de negocios para deluxe almacén de datos

Usted no va a tener la suerte de encontrar ambientes de una sola fuente cuando usted está construyendo un lujoso almacén de datos. Ahora, usted tiene un nuevo conjunto de problemas que debe enfrentar, entre ellos los que están en esta lista…

Fuentes de datos y herramientas de inteligencia de negocios para almacenamiento de datos suprema

Debido a la gran amplitud de temas en un almacén de datos suprema, tiene numerosas fuentes de datos. La buena noticia: Porque muchas de las fuentes son externos a su propio entorno de almacenamiento, usted no es personalmente responsable de toda la…

Text Analytics for big datos no estructurados

Existen numerosos métodos para el análisis de los datos no estructurados para su iniciativa de datos grande. Históricamente, estas técnicas salieron de las áreas técnicas, tales como procesamiento de lenguaje natural (NLP), el descubrimiento…

10 errores de minería de datos comunes (que no vas a hacer)

La minería de datos se hace por ensayo y error, y por eso, para los mineros de datos, cometer errores es natural. Los errores pueden ser valiosos, en otras palabras, al menos bajo ciertas condiciones. No todos los errores son creados iguales, sin…

La minería de datos para los maniquíes

Minero de datos pioneros Thomas Khabaza desarrolló sus "Nueve Leyes de Minería de Datos" para guiar a los nuevos mineros de datos a medida que manos a la obra. Esta guía de referencia que muestra lo que cada una de las leyes de los medios para su…

El dominio de su caja de herramientas de minería de datos

Una gran cantidad de mineros de datos se basan exclusivamente en una pequeña bolsa de trucos de minería de datos que aprendieron hace años y no invierten regularmente tiempo en la adición de nuevas habilidades para la mezcla. El razonamiento es…

maniqui-es.com » Computadoras y software » Big Data » Ingeniería » La minería de datos