Análisis de clientes y períodos de formación y validación

Un enfoque sofisticado ya menudo esencial para el análisis de series de tiempo implica la partición de datos de sus clientes en períodos de entrenamiento y validación. En el período de formación, a construir una ecuación de regresión en la sección primera de datos (aproximadamente dos tercios a tres cuartas partes de sus datos).

A continuación, aplicar la ecuación de regresión en la parte posterior de sus datos en el período de validación para ver qué tan bien los datos anteriores realidad predice los datos posteriores.

Con los datos de suscriptor, puede utilizar los primeros 20 meses (enero 2012 hasta agosto 2013) como el período de formación y septiembre 2013 a febrero 2014 como el período de validación. Este enfoque está poniendo a prueba la ecuación utilizando datos que ya tiene, que es lo más cerca que se puede llegar a probar qué tan bien una predicción podría realizar cuando los nuevos datos entra.

La ecuación de regresión para los primeros 20 meses es:

Suscriptores = 2033.9e0.0269X

El R# 178- = 0,9979, lo que muestra un buen ajuste para la línea exponencial. A continuación, puede utilizar esta ecuación de regresión para ver lo bien que predice los últimos seis meses del conjunto de datos. Los últimos seis meses son 21 a 26. La figura muestra los valores previstos y reales de agosto 2013 a febrero de 2014, marcaron la Validación (en la columna Período).

imagen0.jpg

Para evaluar la eficacia de esta predicción es en realidad, se crearon dos columnas adicionales. El primero es el error prima a partir de la cantidad real a la predicción. Por ejemplo, en septiembre de 2013, la predicción fue corta por 5 suscriptores. En febrero de 2014, fue corto por 28. Este tipo de error prima puede ser en sí mismo comprensible, si usted está familiarizado con los datos del cliente que está trabajando.

Al comunicar la cantidad de error de sus valores pronosticados tienen, a menudo es más fácil hablar en términos de porcentaje de error.

El porcentaje de error absoluto medio (MAPE) puede ser un poco más comprensible para los interesados. Se calcula hallando el valor absoluto de la diferencia entre los valores reales y predichos, a continuación, dividiendo esa diferencia por el valor real para calcular el porcentaje de error absoluto. Esto se promedia a continuación, para cada valor.

image1.jpg

La columna APE muestra el porcentaje de error absoluto. Por ejemplo, para enero de 2013, la ecuación de regresión predijo 2.885 suscriptores, el número real de los suscriptores fue 2844, es decir, la ecuación sobrepronosticó por 41 suscriptores.

Aplicando la fórmula de Excel para el porcentaje de error absoluto (APE) genera un error de 1,4%:

= ABS (2885-2844) / 2885 = 0,014 o 1,4%

La MAPE para el período de formación es 0,589%. La MAPE para el período de validación es 0,870%, lo que es un poco más alto, pero ambos están todavía por debajo del 1%.

Finalmente, las predicciones para marzo, abril y mayo 2014 son 4205, 4320 y 4437.

= EXP (0.0269 * 27) * 2033.9 = 4205= EXP (0.0269 * 28) * 2033.9 = 4320= EXP (0.0269 * 29) * 2033.9 = 4437

Hay una serie de técnicas más sofisticadas que pueden hacer modelos más precisos, tomando en cuenta la estacionalidad y autocorrelación, y luego suavizar los datos para interpretar mejor los patrones. Software como JMP y Minitab tiene estas características incorporadas.

Predecir el futuro es siempre arriesgado porque usted está asumiendo que el futuro va a tener patrones similares a las del pasado. En la mayoría de los casos lo hace y puede ser un excelente predictor del comportamiento de los clientes. Sin embargo, los acontecimientos inusuales (indignados clientes en las redes sociales, un ataque terrorista, o recesión) que son impredecibles pueden afectar sustancialmente la precisión de sus predicciones. Tratar predicciones como una guía, no un absoluto.




» » » » Análisis de clientes y períodos de formación y validación