¿Cómo hacer frente a los problemas en el análisis predictivo
El modelo predictivo está ganando popularidad como una herramienta para la gestión de muchos aspectos del negocio. Asegurar que los análisis de los datos se hace bien aumentará la confianza en los modelos empleados - que, a su vez, pueden generar el buy-in necesario para el análisis predictivo para formar parte del conjunto de herramientas estándar de su organización.
Conteúdo
Tal vez esta creciente popularidad viene de las formas en que un proyecto de análisis predictivo puede apoyar la toma de decisiones mediante la creación de modelos que describen los conjuntos de datos, descubrir posibles nuevos patrones y tendencias (como indican los datos), y predecir los resultados con mayor fiabilidad.
Para lograr este objetivo, un proyecto de análisis predictivo debe entregar un modelo que mejor se ajusta a los datos mediante la selección de las variables de decisión correcta y eficiente. Algunas preguntas vitales deben ser contestadas en el camino a ese objetivo:
¿Cuáles son los supuestos mínimos y variables de decisión que permiten el modelo para adaptarse mejor a los datos?
¿Cómo funciona el modelo en construcción en comparación con otros modelos aplicables?
¿Qué criterios son los mejores para la evaluación y anotar este modelo?
Una vez más, usted puede llamar a la voz de la experiencia al rescate: expertos conocimientos de dominio pueden discutir estas preguntas, interpretar los resultados que muestran patrones ocultos en los datos, y ayudar a verificar y validar la salida del modelo.
¿Cómo describir las limitaciones del modelo de análisis predictivo
Cualquier modelo de análisis predictivo tiene ciertas limitaciones en función de los algoritmos que emplea y el conjunto de datos que se ejecuta. Usted debe ser consciente de esas limitaciones y hacer que funcionen a su ventaja- los relacionados con los algoritmos incluyen
Si los datos tienen patrones no lineales (no forma una línea)
Cómo altamente correlacionadas las variables son (relaciones estadísticas entre características)
Si las variables son independientes (no hay relaciones entre las características)
Si el alcance de los datos de la muestra hace que el modelo propenso a sobreajuste
Para superar las limitaciones de su modelo, el uso de sonido validación cruzada técnicas para poner a prueba sus modelos. Comience por dividir sus datos en la formación y prueba de datos, y ejecutar el modelo contra cada uno de los conjuntos de datos por separado para evaluar y calificar las predicciones del modelo.
Cómo probar y evaluar su modelo de análisis predictivo
Ningún modelo puede producir de 100 por ciento exacta forecasts- cualquier modelo tiene el potencial de producir resultados inexactos. Sé atento a cualquier variación significativa entre las previsiones de su modelo produce y los datos observados - especialmente si las salidas del modelo contradicen el sentido común. Si parece demasiado bueno, malo o extrema para ser verdad, entonces probablemente no es cierto (a la realidad, de todos modos).
En el proceso de evaluación, examinar a fondo las salidas de los modelos que estamos probando y compararlas con las variables de entrada. La capacidad de previsión de su modelo debe responder a todos los objetivos de negocio establecidos que impulsaron su creación en el primer lugar.
Si los errores o sesgos surgen de la producción de su modelo, trate de trazar de nuevo a
La validez, fiabilidad, y la estacionalidad relativa de los datos
Las hipótesis empleadas en el modelo
Las variables que fueron incluidos o excluidos en el análisis
Trabaja con los usuarios de negocios para evaluar cada paso del procesamiento de su modelo de asegurarse de que los resultados de los modelos se pueden interpretar y utilizar fácilmente en una situación de negocio en el mundo real. Equilibrar la exactitud y fiabilidad del modelo con la facilidad con que las salidas del modelo se pueden interpretar y poner en uso práctico.
¿Cómo evitar los modelos de análisis predictivo no escalables
Cuando usted está construyendo un modelo, siempre tener en cuenta la escalabilidad. Compruebe siempre el rendimiento, precisión y fiabilidad del modelo en varias escalas. Su modelo debe ser capaz de cambiar su escala - y ampliar tan grande como sea necesario - sin desmoronarse o salida de malas predicciones.
Escalabilidad era todo un reto en el pasado. Los modelos predictivos tomó mucho tiempo para construir y ejecutar. Los conjuntos de datos de los modelos se ejecutaban en eran pequeños, y los datos era caro para recoger, almacenar y búsqueda. Pero eso fue todo en el " datos pre-grande " era.
Hoy Big Data es barato, abundante, y sigue creciendo. De hecho, otro problema potencial telares: El volumen de datos formidable actualmente disponible puede afectar negativamente el modelo y degradar su rendimiento, outdating el modelo en un período relativamente corto de tiempo. Correctamente implementado, escalabilidad puede ayudar " a prueba de futuro " su modelo.
El futuro no es la única amenaza. Incluso en la época actual en línea, streaming de datos pueden abrumar a un modelo - especialmente si las corrientes de aumento de datos a una inundación.
Volumen de datos por sí solo puede hacer que las variables de decisión y los factores que predicen creciendo a números gigantes que requieren actualización continua al modelo. Así que sí, el modelo tenía sea escalable mejor - rápidamente escalable.