Cómo utilizar regresiones lineales en el análisis predictivo

Regresión lineal es un método estadístico que analiza y descubre relaciones entre dos variables. En el análisis predictivo puede ser utilizado para predecir un valor numérico futuro de una variable.

Considere un ejemplo de datos que contiene dos variables: datos del pasado que consiste en los tiempos de llegada de un tren y su tiempo de demora correspondiente. Suponga que desea predecir lo que el retraso sería que el próximo tren. Si se aplica la regresión lineal para estas dos variables - la llegada y los tiempos de retraso - se puede generar una ecuación lineal como

Delay = a + (b * Hora de llegada) + d

Esta ecuación expresa la relación entre tiempo de retardo y la hora de llegada. Las constantes la y b son los parámetros del modelo. La variable d es el término de error (también conocido como el resto) - Un valor numérico que representa la falta de correspondencia entre las dos variables retraso y hora de llegada. Si el error no es igual a cero, entonces eso podría indicar que hay criterios que afectan a la variable retraso.

Si usted está sentado en la estación de tren, sólo tiene que enchufar el tiempo de llegada a la ecuación anterior y se puede calcular el retraso era de esperar, el uso de parámetros dados del modelo de regresión lineal una B, y d.

La regresión lineal es (como se puede imaginar) más adecuado para los datos lineales. Pero es muy sensible a los valores extremos en los puntos de datos. Los valores atípicos en los datos pueden tener un impacto significativo en el modelo. Se recomienda que quite esos valores extremos del conjunto de entrenamiento si usted está planeando utilizar la regresión lineal para su modelo predictivo.




» » » » Cómo utilizar regresiones lineales en el análisis predictivo