Predecir los valores de los clientes con la línea de regresión

Mientras que una correlación habla a la fuerza de una relación entre dos variables, y el r2 ayuda a explicar que la fuerza de la relación, lo que tiene que hacer para predecir una variable de otro es el uso de una extensión de correlación llamado análisis de regresión. Análisis de regresión que se conoce como una " caballo de batalla " en el análisis predictivo. La matemática no es demasiado complicado, y la mayoría de los paquetes de software compatible con el análisis de regresión.

El análisis de regresión se extiende la idea de la dispersión usada en correlación y añade una línea que mejor " encaja " los datos.

Uno de los requisitos de la utilización de correlaciones y análisis de regresión es que los datos es lineal. Lineal significa una línea puede describir razonablemente la relación entre las variables y luego ser utilizado para predecir los valores que no aparecen en los datos (puntos futuro de datos de clientes). Si el diagrama de dispersión de los datos forma una curva, o cualquier forma que una línea no encaja bien, puede obtener resultados engañosos.

Si bien hay muchas maneras de dibujar líneas a través de los datos, el análisis de mínimos cuadrados es una forma matemática que reduce la distancia entre la línea y cada punto en el diagrama de dispersión. Este análisis se puede hacer a mano o mediante el uso de software tal como Minitab, SPSS, SAS, R, o Excel.

La figura muestra una línea de regresión de mínimos cuadrados.

imagen0.jpg

El software le da la ecuación de la recta de regresión encima del gráfico:

Tiempo = 86.57 + 4.486 Taps

La ecuación de regresión adopta la forma general de

image1.jpg

He aquí una explicación de cada parte de la ecuación:

image2.jpg

(pronunciado y-sombrero): Este es el valor predicho de la variable dependiente: pronosticado tiempo.

  • b0: Llamó al y-interceptar, aquí es donde la línea cruzaría (o intersección) con el y-eje.

  • b1: Esta es la pendiente de la línea prevista (lo empinada que es).

  • X: Esto representa un valor particular de la variable independiente: grifos.

  • e: representa el error inevitable la predicción va a contener.

Así, en este ejemplo, la ecuación de regresión indica que la cantidad predicha de tiempo que tarda un cliente para hacer una compra es igual a 86.57 (la y-intercepción) más 4.486 (la pendiente) multiplicado por el número de tomas (X).

Es la fórmula de regresión que permite predecir los valores de los clientes que no existen en los datos. Se le permite realizar " what-if " análisis sobre los valores de los clientes futuros. Este es el " predictivo " parte del análisis predictivo de los clientes.

Por ejemplo, el uso de la ecuación de regresión del ejemplo anterior, se puede predecir el tiempo que un cliente necesita para hacer una compra con 38 grifos. Usted acaba de llenar 38 en la ecuación de regresión.

Tiempo = 86,57 + 4,486 (38)Tiempo = 86,57 + 170,47 = 257,04

Un cliente necesita 257 segundos, o un poco más de cuatro minutos, para hacer una compra que requiere 38 grifos.

Se denota la variable dependiente " Y " y se muestra en el eje Y (vertical). La variable independiente se denomina X y se muestra en el eje horizontal (x).

En lugar de predecir el tiempo de la tarea de un cliente de los grifos, este mismo enfoque puede ser utilizado para predecir otros análisis de clientes, incluyendo:

  • Los ingresos del cliente según los ingresos por publicidad

  • Probabilidad de recomendar a partir de datos de usabilidad

  • Número de conversiones de páginas web vistas




» » » » Predecir los valores de los clientes con la línea de regresión