Cómo evaluar los datos lineales con r

Naturalmente, R ofrece toda una serie de diferentes pruebas y medidas para evaluar qué tan bien el modelo se ajuste a sus datos, así como ver los supuestos del modelo. Una vez más, el panorama que se presenta aquí está lejos de ser completa, pero te da una idea de lo que es posible y un punto de partida para profundizar en el tema.

¿Cómo resumir el modelo

los Resumen () la función de inmediato le devuelve la prueba F para los modelos construidos con AOV (). por lm () modelos, esto es ligeramente diferente. Echa un vistazo a la salida:

> Model.summary lt; - Resumen (Modelo)> Model.summaryCall: lm (fórmula = ~ mpg en peso, = datos mtcars) Residuos: Min Mediana 1T 3T Max-4,5432 -2,3647 -0,1252 1,4096 6.8727Coefficients: Estimación Std. Pr Error valor t (> | t |) (Intercepción) 37.2851 1.8776 19.858 lt; 2e-16 *** peso -5.3445 0.5591 -9.559 1.29e-10 *** --- Signif. códigos: 0 '***' 0.001 '**' 0.01 '*' 0.05 ''. Error estándar de 0,1 '' 1Residual: 3.046 en 30 grados de freedomMultiple R-cuadrado: 0.7528, ajustado R-cuadrado: 0.7446F-estadística: 91.38 los días 1 y 30 DF, p-valor: 1.294e-10

Eso es un montón de información útil. Aquí puede ver lo siguiente:

  • La distribución de los residuos, lo que le da una primera idea sobre qué tan bien los supuestos de un modelo lineal de retención

  • Los coeficientes acompañados por un t-test, que le dice en qué punto cada coeficiente difiere significativamente de cero

  • La medidas de bondad de ajuste R2 y el R ajustado2

  • La prueba F que le da una idea acerca de si su modelo explica una parte significativa de la varianza en los datos

Puede utilizar el coef () función para extraer una matriz con las estimaciones, los errores estándar, y t-valor y el valor de p para los coeficientes del objeto resumen así:

> Coef (Model.summary) Estimación Std. Valor de error t Pr (> | t |) (Intercepción) 37.285126 1.877627 19.857575 8.241799e-19wt -5.344472 0.559101 -9.559044 1.293959e-10

Si estos términos no te dicen nada, mirar hacia arriba en una buena fuente sobre el modelado. Para una extensa introducción a la aplicación e interpretación correcta modelos lineales, echa un vistazo Modelos Applied Linear estadísticos, Quinta edición, por Michael Kutner et al (McGraw-Hill / Irwin).

Cómo probar el impacto de los términos del modelo

Para obtener un análisis de varianza de mesa - como el Resumen () función hace que para un modelo de ANOVA - sólo tiene que utilizar el anova () funcionar y pasarlo al lm () modelo de objetos como argumento, como esto:

> Model.anova lt; - ANOVA (Model)> Model.anovaAnalysis de Varianza TableResponse: mpgDf Sum Sq Mean Square valor F Pr (> F) en peso 1 847,73 847,73 91.375 1.294e-10 *** Residuales 30 278,32 9,28 --- Signif. códigos: 0 '***' 0.001 '**' 0.01 '*' 0.05 ''. 0.1 '' 1

En este caso, el objeto resultante es una trama de datos que le permite extraer cualquier valor de esa tabla utilizando las herramientas subconjuntos e indexación. Por ejemplo, para obtener el p-valor, puede hacer lo siguiente:

> Model.anova ['peso', 'Pr (> F)'] [1] 1.293959e-10

Puede interpretar este valor como la probabilidad de que la adición de la variable en peso el modelo no hace una diferencia. El p-valor bajo aquí indica que el peso de un coche (en peso) Explica una parte significativa de la diferencia en el kilometraje (mpg) Entre los coches. Esto no debería ser una sorpresa- un coche más pesado lo hace, de hecho, necesitan más poder para arrastrar su propio peso alrededor.

Puede utilizar el anova () función para comparar diferentes modelos, así, y muchos paquetes de modelado proporciona esa funcionalidad. Usted encontrará ejemplos de esto en la mayoría de las páginas de Ayuda relacionados como ?anova.lm y ?anova.glm.




» » » » Cómo evaluar los datos lineales con r