Cómo calcular una línea de regresión
En estadística, se puede calcular una línea de regresión de dos variables si su diagrama de dispersión muestra un patrón lineal y la correlación entre las variables es muy fuerte (por ejemplo, r
Conteúdo
La fórmula para el línea de mejor ajuste (o línea de regresión) es y = mx + b, dónde m es la pendiente de la línea y b es el y-intercepción. Esta ecuación en sí es el mismo utilizado para encontrar una línea en algebra- pero recuerda, en las estadísticas de los puntos no mienten perfectamente en una línea - la línea es un modelo en torno al cual los datos se encuentran si existe un fuerte patrón lineal.
los cuesta abajo de una línea es el cambio en Y sobre el cambio en X. Por ejemplo, una pendiente de
significa que el X-incrementos de valor (mueve la derecha) por 3 unidades, el y-valor se mueve hacia arriba por 10 unidades en promedio.
los intercepto es el valor en el eje y donde la línea cruza. Por ejemplo, en la ecuación y = 2X - 6, la línea cruza el y-eje en el valor b = -6. Las coordenadas de este punto son (0, -6) - cuando una línea cruza el y-eje, el X-valor es siempre 0.
Usted puede pensar que usted tiene que probar un montón y un montón de diferentes líneas para ver cuál se adapta mejor. Afortunadamente, usted tiene una opción más sencilla (aunque echando un vistazo a una línea en el diagrama de dispersión sí le ayuda a pensar en lo que se espera que la respuesta sea). La línea de mejor ajuste tiene una pendiente distinta y y-intercepción que se puede calcular mediante fórmulas (y estas fórmulas no son demasiado difícil de calcular).
Para guardar una gran cantidad de tiempo para calcular la mejor línea de ajuste, primero encontrar la " cinco grandes, " cinco estadísticas de resumen que necesitará en sus cálculos:
La media de la X valores
La media de la y valores
La desviación estándar de la X valores (denotados sX)
La desviación estándar de la y valores (denotados sy)
La correlación entre X y Y (denotado r)
Encontrar la pendiente de una recta de regresión
La fórmula para la pendiente, m, de la línea de mejor ajuste es
dónde r es la correlación entre X y Y, y sX y sy son las desviaciones estándar de la X-valores y la y-valores, respectivamente. Sólo tiene que dividir sy por sX y multiplicar el resultado por r.
Tenga en cuenta que la pendiente de la línea de mejor ajuste puede ser un número negativo, porque la correlación puede ser un número negativo. Una pendiente negativa indica que la línea va cuesta abajo. Por ejemplo, si un aumento en los agentes de policía se relaciona con una disminución en el número de delitos en una moda- lineal entonces la correlación y por lo tanto la pendiente de la línea de mejor ajuste es negativo en este caso.
La correlación y la pendiente de la línea de mejor ajuste no son los mismos. La fórmula para la pendiente lleva la correlación (una medida sin unidades) y se une unidades a la misma. Pensar en sy Dividido por sX como la variación (modificar parecido) en Y sobre la variación de X, en unidades de X y Y. Por ejemplo, la variación en la temperatura (grados Fahrenheit) sobre la variación en el número de chirridos del grillo (en 15 segundos).
Encontrar la intersección y de una línea de regresión
La fórmula para el y-interceptar, b, de la línea de mejor ajuste es
son los medios de la X-valores y la y-valores, respectivamente, y m es la pendiente.
Así que para calcular el y-interceptar, b, de la línea de mejor ajuste, se inicia mediante la búsqueda de la pendiente, m, de la línea que mejor se ajusta mediante los pasos anteriores. Luego de encontrar el y-interceptar, multiplicas m por
Siempre calcular la pendiente antes de la y-intercepción. La fórmula para el y-intercepción contiene la pendiente!