Cómo modelar las relaciones de datos lineales con r

Un análisis de varianza para los datos también se puede escribir como modelo lineal

en I, en el que utiliza un factor como una variable predictora de modelar una variable de respuesta.

Por supuesto, variables de predicción también pueden ser variables continuas. Por ejemplo, el peso de un automóvil, obviamente, tiene una influencia en el kilometraje. Pero sería bueno tener una idea acerca de la magnitud de esa influencia. Esencialmente, usted desea encontrar la ecuación que representa la línea de tendencia. Usted encontrará la información que necesita para comprobar esto en el conjunto de datos mtcars.

image0.jpg

¿Cómo construir un modelo lineal

los lm () función le permite especificar cualquier cosa, desde el modelo lineal más simple de modelos de interacción complejas.

Para modelar el kilometraje en función del peso de un coche, utiliza el lm () función, así:

> Modelo lt; - lm (mpg ~ = WT, datos mtcars)

Usted suministra dos argumentos:

  • Una fórmula que describe el modelo: Aquí, modelar la variable mpg como una función de la variable en peso.

  • Una trama de datos que contiene las variables de la fórmula: En este caso, se utiliza el marco de datos mtcars.

Puede especificar muchos modelos complejos con la interfaz de fórmula cuando usted sabe su manera alrededor.

El objeto resultante es una lista con una estructura muy compleja, pero en la mayoría de los casos no es necesario que preocuparse por eso. El objeto de modelo contiene una gran cantidad de información que se necesita para los cálculos de diagnóstico y nuevas predicciones.

¿Cómo extraer información del modelo

En lugar de sumergirse en el propio objeto de modelo y la búsqueda de la información en alguna parte del objeto de la lista, puede utilizar algunas de las funciones que le ayudan a obtener la información necesaria de la modelo. Por ejemplo, puede extraer un vector llamado con los coeficientes del modelo usando el coef () función, así:

> Coef.Model lt; - coef (Modelo)> coef.Model (Intercepción) wt37.285126 -5.344472

Estos coeficientes representan el intercepto y la pendiente de la línea de tendencia. Usted puede usar esto para trazar la línea de tendencia en un diagrama de dispersión de los datos. Esto se hace en dos pasos:

  1. Trazar el diagrama de dispersión con los datos.

    Se utiliza el gráfico() función para eso.

  2. Se utiliza el abline () función para dibujar la línea de tendencia a partir de los coeficientes.

El siguiente código le da el terreno:

> Plot (mpg ~ peso, data = mtcars)> abline (a = coef.Model [1], b = coef.Model [2])

los abline () argumento la representa el intercepto, y b representa la pendiente de la línea de tendencia que desea trazar. Trazar una línea vertical estableciendo el argumento v a la intersección con el X-eje en su lugar. Las líneas horizontales se representan estableciendo el argumento v a la intersección con el y-eje.

A continuación se muestra una visión general de las funciones para extraer información de la propia objeto modelo. Estas funciones trabajan con diferentes objetos del modelo, incluyendo las construidas por AOV () y lm ().

Muchos autores de paquetes también ofrecen las mismas funciones para los modelos construidos por las funciones en su paquete. Por lo tanto, siempre se puede tratar de utilizar estas funciones de extracción en combinación con otras funciones de modelo así.

FunciónQue hace
coef ()Devuelve un vector con los coeficientes del modelo
CONFINT ()Devuelve una matriz con el límite superior e inferior del intervalo de theconfidence para cada coeficiente del modelo
equipada ()Devuelve un vector con los valores ajustados para everyobservation
residuos ()Devuelve un vector con los residuales para cada observación
vcov ()Devuelve la matriz de varianza-covarianza para el coeficiente



» » » » Cómo modelar las relaciones de datos lineales con r