10 errores de minería de datos comunes (que no vas a hacer)

La minería de datos se hace por ensayo y error, y por eso, para los mineros de datos, cometer errores es natural. Los errores pueden ser valiosos, en otras palabras, al menos bajo ciertas condiciones. No todos los errores son creados iguales, sin embargo. Algunos son simplemente mejor evitar. La siguiente lista ofrece diez dichos errores. Si usted lee a través de ellos con cuidado, y se compromete a la memoria, que sólo podría evitar unos golpes en la curva de aprendizaje:

  • Saltarse los controles de calidad de datos: La mayoría de los mineros de datos piensan desarrollar modelos de predicción es más divertido que la revisión de los datos para los problemas de calidad. Pero si usted no puede detectar y problemas de calidad de datos correctos, usted podría terminar con las predicciones sin valor.

  • Falta el punto: Has descubierto algo fascinante! Eso está bien, pero si no es también relevante para el problema de negocio que se dispuso a resolver, así, no es relevante en absoluto. Volver a la pista.

  • Creer que un patrón en los datos de prueba una relación de causa y efecto: Usted explorar un conjunto de datos y la cuenta de que cuando aumenta una variable, aumenta B variable, también. Esto podría ocurrir porque una variable influye Variable B, o porque las influencias B Variable Variable A. Por otro lado, podría ser que ambos están influenciados por alguna otra variable que usted no ha considerado. O podría ser una coincidencia de una sola vez. ¿Quién puede decir?

  • Estirar conclusiones demasiado lejos: No presumen que las relaciones que observamos en los datos se repetirán en diferentes circunstancias. Si los datos se recogieron en un ambiente fresco, no asuma que las cosas funcionarán de la misma manera en un ajuste de fábrica caliente.

  • Las apuestas en resultados que no tienen sentido: Métodos de minería de datos son informales y no suele ser respaldado por el método científico y la teoría, por lo que sus resultados mejor que al menos tiene sentido empresarial. Si no hay explicación de sentido común para los resultados que presentes, su dirección ejecutiva, probablemente no lo tomará en serio, y que no debería.

  • Enamorarse de un método de modelado en particular: No hay un solo tipo de modelo de minería de datos que se ajuste a todas las situaciones.

  • Poner un modelo en producción sin pruebas adecuadas: No apueste su negocio en un modelo predictivo hasta que haya probado con datos de exclusión y en pequeña escala en el campo.

  • Haciendo caso omiso de los resultados que no te gusta: Si ignora sus datos ahora, se va a volver un día y decir: "te lo dije".

  • El uso de minería de datos para hacer frente a todas las necesidades de análisis de datos: La minería de datos tiene un gran valor, sin embargo, algunas aplicaciones todavía exigen rigurosos métodos de recolección de datos, análisis estadístico formal, y el método científico.

  • Suponiendo que las técnicas de análisis de datos tradicionales ya no importa: Consulte el punto anterior.




» » » » 10 errores de minería de datos comunes (que no vas a hacer)