La minería de datos para los maniquíes
Minero de datos pioneros Thomas Khabaza desarrolló sus "Nueve Leyes de Minería de Datos" para guiar a los nuevos mineros de datos a medida que manos a la obra. Esta guía de referencia que muestra lo que cada una de las leyes de los medios para su trabajo diario.
Primera ley de minería de datos, o "Metas de Negocio Derecho": Los objetivos de negocio son el origen de todas las soluciones de minería de datos.
Un minero de datos es alguien que descubre información útil de datos para apoyar los objetivos de negocio específicos. La minería de datos no está definido por la herramienta que utilice.
Segunda ley de minería de datos, o "Ley Conocimiento de negocios": Conocimiento de negocios es fundamental para cada paso del proceso de minería de datos.
Usted no tiene que ser un estadístico de lujo para hacer minería de datos, pero usted tiene que saber algo acerca de lo que el significa de datos y cómo funciona el negocio.
Tercera ley de minería de datos o "Ley de Preparación de datos": Preparación de datos es más de la mitad de todos los procesos de minería de datos.
Casi todos minero de datos pasará más tiempo en la preparación de los datos que en el análisis.
Cuarta ley de minería de datos, o "No Free Lunch para el minero de datos": El modelo adecuado para una aplicación determinada sólo puede ser descubierto por el experimento.
En la minería de datos, se seleccionan los modelos a través de ensayo y error.
Quinta Ley de Minería de Datos: Siempre hay patrones en los datos.
Como un minero de datos, a explorar los datos en busca de patrones útiles. La comprensión de los patrones en los datos le permite influir en lo que sucede en el futuro.
Ley 6 de minería de datos, o "Ley Insight": La minería de datos amplifica la percepción en el dominio del negocio.
Métodos de minería de datos le permiten entender su negocio mejor que usted podría haber hecho sin ellos.
Séptima ley de minería de datos o "Ley de Predicción": Predicción aumenta la información a nivel local por la generalización.
La minería de datos nos ayuda a usar lo que sabemos hacer mejores predicciones (o estimaciones) de las cosas que no sabemos.
8 de la Ley de Minería de Datos, o "Ley de Valor": El valor de los resultados de minería de datos no está determinada por la exactitud o la estabilidad de los modelos predictivos.
Su modelo debe producir buenas predicciones, de forma coherente. Eso es.
9 de la Ley de Minería de Datos, o "Ley del Cambio": Todos los modelos están sujetos a cambios.
Cualquier modelo que le da grandes predicciones de hoy puede ser mañana inútil.
Fases del proceso de minería de datos
los Cruz-industria de procesos estándar para la minería de datos (CRISP-DM) Es el marco de proceso de minería de datos dominante. Se trata de una cualquiera de normas abiertas puede utilizarlo. La siguiente lista describe las distintas fases del proceso.
La identificación de sus objetivos de negocio
La evaluación de su situación
La definición de sus objetivos de minería de datos
Producir el plan del proyecto
La comprensión de los datos: Revise los datos que usted tiene, documentarlo, identificar a la gestión de datos y los problemas de calidad de datos. Tareas para esta fase son:
Reuniendo datos
Describiendo
Explorar
Verificación de la calidad
Preparación de datos: Obtener los datos listos para usar para el modelado. Tareas para esta fase son:
Selección de los datos
Limpieza de datos
Construcción
Integración
Formateo
Modelado: Utilice técnicas matemáticas para identificar patrones en los datos. Tareas para esta fase son:
Selección de las técnicas
Pruebas de Proyectos
La construcción de modelos
La evaluación de los modelos
Evaluación: Revise los patrones que has descubierto y evaluar su potencial para uso empresarial. Tareas para esta fase son:
La evaluación de los resultados
Revisar el proceso
Determinar los próximos pasos
Despliegue: Ponga sus descubrimientos a trabajar en el negocio todos los días. Tareas para esta fase son:
Despliegue Planificación (sus métodos para integrar los descubrimientos de minería de datos en uso)
Reporte los resultados finales
Revisión de los resultados finales
Sobre el autor
Administrar el alcance de un proyecto de minería de datos No son sólo sus propios intereses que pueden causar el alcance de un proyecto para ampliar. A medida que trabaja, podrás tener discusiones con los compañeros de trabajo, y todos ellos tendrás ideas y preguntas para inspirar una mayor…
Fusión y anexar los datos Cuando los datos están en más de un lugar, necesita maneras de poner todo junto. Cuando se une a dos conjuntos de datos con diferentes variables, eres la fusión datos. La fusión es una operación común. La fusión se utiliza con frecuencia en…
Fase 1 del modelo de proceso CRISP-DM: comprensión del negocio los Cruz-industria de procesos estándar para la minería de datos (CRISP-DM) Es el marco de proceso dominante para la minería de datos. En la primera fase de un proyecto de minería de datos, antes de acercarse a los datos o herramientas, defina…
¿Cómo generar análisis predictivo con datos e impulsado por los datos de usuario Hay dos maneras de ir sobre la generación o aplicación de análisis predictivo: puramente en la base de datos (sin conocimiento previo de lo que está buscando) o con un objetivo de negocio propuesto que los datos pueden o no pueden soportar.…
Minería sus datos utilizando la ciencia de datos En la era de los grandes datos, parece que las organizaciones de todo tipo y tamaño están en una misión de contratación. Quieren contratar a científicos de datos para que puedan utilizar los datos y la toma de decisiones los datos informados…
La minería de datos La característica distintiva sobre la minería de datos, en comparación con las consultas, informes, o incluso OLAP, es que se puede obtener información sin tener que hacer preguntas específicas.La minería de datos cumple dos funciones…
La minería de datos para los datos de gran La minería de datos consiste en explorar y analizar grandes cantidades de datos para encontrar las pautas de los grandes datos. Las técnicas salieron de los campos de la estadística y la inteligencia artificial (IA), con un poco de gestión de…
La minería de datos para el almacenamiento de datos A veces, la minería de datos para el almacenamiento de datos no se mezcla con las otras formas de inteligencia de negocios. Esta falta de integración se produce por dos razones:Los usuarios de negocios no tienen el conocimiento requerido en bases…
Fuentes de datos y herramientas de inteligencia de negocios para almacenamiento de datos suprema Debido a la gran amplitud de temas en un almacén de datos suprema, tiene numerosas fuentes de datos. La buena noticia: Porque muchas de las fuentes son externos a su propio entorno de almacenamiento, usted no es personalmente responsable de toda la…
Los componentes clave de Microsoft SQL Server El producto de Microsoft SQL Server se compone de cuatro componentes principales, tres de ellos siglas deportivos. Utilice esta lista para identificar los componentes de SQL Server y distinguirlos.Base de datos del motor: Esta parte de SQL Server en…
10 errores de minería de datos comunes (que no vas a hacer) La minería de datos se hace por ensayo y error, y por eso, para los mineros de datos, cometer errores es natural. Los errores pueden ser valiosos, en otras palabras, al menos bajo ciertas condiciones. No todos los errores son creados iguales, sin…
El dominio de su caja de herramientas de minería de datos Una gran cantidad de mineros de datos se basan exclusivamente en una pequeña bolsa de trucos de minería de datos que aprendieron hace años y no invierten regularmente tiempo en la adición de nuevas habilidades para la mezcla. El razonamiento es…