Cómo analizar las variaciones de datos en modelos con r
Un análisis de la varianza (ANOVA) es una técnica muy común que se utiliza con R para comparar las medias entre los diferentes grupos de datos. Para ilustrar esto, echar un vistazo a la base de datos InsectSpray
:> Str (InsectSprays) 'data.frame': 72 obs. de 2 variables: $ count: num 7 20 14 10 14 12 10 23 17 20 ... $ aerosol: Factor w / 6 niveles "A", "B", "C", "D", ..: 1 1 1 1 1 1 1 1 1 1 ...
Este conjunto de datos contiene los resultados de un experimento agrícola. Seis insecticidas se pusieron a prueba en 12 campos de cada uno, y los investigadores contaron el número de molestos insectos que quedaron en cada campo. Ahora los agricultores necesitan saber si los insecticidas hacen ninguna diferencia, y si es así, cuál de ellos mejor uso. Su respuesta a esta pregunta mediante el uso de la AOV () funcionar para llevar a cabo un ANOVA.
¿Cómo construir el modelo
Por este simple ejemplo, la construcción del modelo es un pedazo de pastel. Esencialmente desea modelar los medios para la variable contar como una función de la variable rociar. Traducir eso a R como esto:
> AOVModel lt; - aov (recuento ~ = pulverización, datos InsectSprays)
Se pasa dos argumentos a la AOV () función en esta línea de código:
La formula contar ~ aerosol, que dice lo " contar como una función del aerosol "
El argumento datos, donde se especifica la trama de datos en la que se pueden encontrar las variables de la fórmula
Todas las funciones de modelado devuelve un objeto de modelo con una gran cantidad de información sobre el modelo ajustado. Siempre poner este objeto modelo en una variable. De esta manera usted no tiene que volver a montar el modelo cuando se necesita para realizar cálculos adicionales.
Cómo mirar el objeto de modelo
Al igual que con todos los objetos, se puede mirar a un objeto modelo con tan sólo escribir su nombre en la consola. Si lo haces para el objeto Modelo que ha creado, verá el siguiente resultado:
> AOVModelCall: AOV (fórmula = contar ~ aerosol, = datos InsectSprays) Condiciones: spray ResidualsSum de cuadrados 2668.833 1015.167Deg. de error estándar Freedom566Residual: efectos 3.921902Estimated pueden ser desequilibrada
Esto no le dice mucho, aparte de la orden (o el llamada) Que utilizó para construir el modelo y la información básica sobre el resultado apropiado.
En la salida, también se lee que los efectos estimados pueden ser desequilibrado. Esto no es una advertencia - es un mensaje que se construye en el autor de la AOV () función. Éste puede aparecer en dos situaciones:
Usted no tiene el mismo número de casos en cada grupo.
Usted no establecer contrastes ortogonales.
En este caso, es la segunda razón.