10 errores de minería de datos comunes (que no vas a hacer)
La minería de datos se hace por ensayo y error, y por eso, para los mineros de datos, cometer errores es natural. Los errores pueden ser valiosos, en otras palabras, al menos bajo ciertas condiciones. No todos los errores son creados iguales, sin embargo. Algunos son simplemente mejor evitar. La siguiente lista ofrece diez dichos errores. Si usted lee a través de ellos con cuidado, y se compromete a la memoria, que sólo podría evitar unos golpes en la curva de aprendizaje:
Saltarse los controles de calidad de datos: La mayoría de los mineros de datos piensan desarrollar modelos de predicción es más divertido que la revisión de los datos para los problemas de calidad. Pero si usted no puede detectar y problemas de calidad de datos correctos, usted podría terminar con las predicciones sin valor.
Falta el punto: Has descubierto algo fascinante! Eso está bien, pero si no es también relevante para el problema de negocio que se dispuso a resolver, así, no es relevante en absoluto. Volver a la pista.
Creer que un patrón en los datos de prueba una relación de causa y efecto: Usted explorar un conjunto de datos y la cuenta de que cuando aumenta una variable, aumenta B variable, también. Esto podría ocurrir porque una variable influye Variable B, o porque las influencias B Variable Variable A. Por otro lado, podría ser que ambos están influenciados por alguna otra variable que usted no ha considerado. O podría ser una coincidencia de una sola vez. ¿Quién puede decir?
Estirar conclusiones demasiado lejos: No presumen que las relaciones que observamos en los datos se repetirán en diferentes circunstancias. Si los datos se recogieron en un ambiente fresco, no asuma que las cosas funcionarán de la misma manera en un ajuste de fábrica caliente.
Las apuestas en resultados que no tienen sentido: Métodos de minería de datos son informales y no suele ser respaldado por el método científico y la teoría, por lo que sus resultados mejor que al menos tiene sentido empresarial. Si no hay explicación de sentido común para los resultados que presentes, su dirección ejecutiva, probablemente no lo tomará en serio, y que no debería.
Enamorarse de un método de modelado en particular: No hay un solo tipo de modelo de minería de datos que se ajuste a todas las situaciones.
Poner un modelo en producción sin pruebas adecuadas: No apueste su negocio en un modelo predictivo hasta que haya probado con datos de exclusión y en pequeña escala en el campo.
Haciendo caso omiso de los resultados que no te gusta: Si ignora sus datos ahora, se va a volver un día y decir: "te lo dije".
El uso de minería de datos para hacer frente a todas las necesidades de análisis de datos: La minería de datos tiene un gran valor, sin embargo, algunas aplicaciones todavía exigen rigurosos métodos de recolección de datos, análisis estadístico formal, y el método científico.
Suponiendo que las técnicas de análisis de datos tradicionales ya no importa: Consulte el punto anterior.
Sobre el autor
Cómo preparar los datos para un modelo de análisis predictivo Cuando haya definido los objetivos del modelo de análisis predictivo, el siguiente paso es identificar y preparar los datos que va a utilizar para construir su modelo. La secuencia general de pasos es la siguiente:Identificar las fuentes de…
Cómo probar el modelo de análisis predictivo Para poner a prueba el modelo de análisis predictivo que construiste, es necesario dividir el conjunto de datos en dos conjuntos: formación y la prueba conjuntos de datos. Estos conjuntos de datos deben ser seleccionados al azar y deben ser una…
Cómo utilizar la analítica supervisadas para entrenar modelos predictivos En análisis supervisadas, tanto de entrada como de salida preferidos son parte de los datos de entrenamiento. El modelo de análisis predictivo se presenta con los resultados correctos como parte de su proceso de aprendizaje. Tal aprendizaje…
Cómo utilizar regresiones lineales en el análisis predictivo Regresión lineal es un método estadístico que analiza y descubre relaciones entre dos variables. En el análisis predictivo puede ser utilizado para predecir un valor numérico futuro de una variable.Considere un ejemplo de datos que contiene dos…
Minería sus datos utilizando la ciencia de datos En la era de los grandes datos, parece que las organizaciones de todo tipo y tamaño están en una misión de contratación. Quieren contratar a científicos de datos para que puedan utilizar los datos y la toma de decisiones los datos informados…
La minería de datos para los datos de gran La minería de datos consiste en explorar y analizar grandes cantidades de datos para encontrar las pautas de los grandes datos. Las técnicas salieron de los campos de la estadística y la inteligencia artificial (IA), con un poco de gestión de…
La minería de datos para el almacenamiento de datos A veces, la minería de datos para el almacenamiento de datos no se mezcla con las otras formas de inteligencia de negocios. Esta falta de integración se produce por dos razones:Los usuarios de negocios no tienen el conocimiento requerido en bases…
Determinar el papel de las variables en psicología estadística En psicología estadística, estudios de investigación que impliquen la recolección datos cuantitativos (todos los datos que se puede contar o representa como números) por lo general requieren que usted pueda recoger y almacenar datos en una hoja…
Recopilación y validación de datos de los estudios clínicos Si el formulario de reporte de caso (CRF) ha sido cuidadosamente diseñado y lógicamente, la introducción de datos de cada sujeto en el lugar correcto en el CRF debe ser sencillo. Entonces usted necesita para obtener estos datos en un ordenador…
¿Cómo lidiar con los datos que faltan de un ensayo clínico La mayoría de los ensayos clínicos tienen datos incompletos para una o más variables, que pueden ser un verdadero dolor de cabeza en el análisis de sus datos. Los aspectos estadísticos de los datos que faltan son bastante complicado, así que…
La minería de datos para los maniquíes Minero de datos pioneros Thomas Khabaza desarrolló sus "Nueve Leyes de Minería de Datos" para guiar a los nuevos mineros de datos a medida que manos a la obra. Esta guía de referencia que muestra lo que cada una de las leyes de los medios para su…
El dominio de su caja de herramientas de minería de datos Una gran cantidad de mineros de datos se basan exclusivamente en una pequeña bolsa de trucos de minería de datos que aprendieron hace años y no invierten regularmente tiempo en la adición de nuevas habilidades para la mezcla. El razonamiento es…