Cómo delinear las pruebas y datos de prueba para el análisis predictivo

Cuando los datos están listos y ya está a punto de comenzar la construcción de su modelo predictivo para el análisis, es útil para delinear su metodología de pruebas y elaborar un plan de pruebas. La prueba debe ser impulsada por los objetivos de negocio que ha reunido, documentado, y se recoge toda la información necesaria para ayudarle a alcanzar.

De buenas a primeras, se debe diseñar un método para probar si un objetivo de negocio se ha alcanzado con éxito. Desde el análisis predictivo miden la probabilidad de un resultado futuro - y la única manera de estar listo para correr una prueba de este tipo es mediante la capacitación de su modelo en los datos del pasado, usted todavía tiene que ver lo que puede hacer cuando se está en contra de los datos futuros.

Por supuesto, no se puede correr el riesgo de la ejecución de un modelo no probado en los datos futuros reales, por lo que tendrás que utilizar los datos existentes para simular los datos futuros realista. Para ello, hay que dividir los datos que está trabajando en la formación y la prueba conjuntos de datos.

Asegúrese de que selecciona estos dos conjuntos de datos al azar, y que ambos conjuntos de datos contienen y cubren todos los parámetros de datos que estés medición.

Al dividir sus datos en conjuntos de datos de prueba y de capacitación, usted está evitando eficazmente cualquier problema sobreajuste que podrían derivarse de sobreentrenamiento el modelo en todo el conjunto de datos y recoger todos los patrones de ruido o características específicas que sólo pertenecen al conjunto de datos de la muestra y no son aplicable a otros conjuntos de datos.

La separación de sus datos en la formación y prueba de datos, alrededor del 70 por ciento y 30 por ciento, respectivamente, asegura una medición precisa del rendimiento del modelo de análisis predictivo que estamos construyendo. Usted desea evaluar su modelo frente a los datos de prueba, porque es una forma sencilla de medir si las predicciones del modelo son exactas.




» » » » Cómo delinear las pruebas y datos de prueba para el análisis predictivo