La idea básica de un análisis de varianza (ANOVA)
El llamado " análisis unidireccional de varianza " (ANOVA) se usa cuando se comparan tres o más grupos de números. Al comparar los dos grupos (A y B), se prueba la diferencia (A - B) entre los dos grupos con una prueba t de Student. Así que cuando se comparan tres grupos (A, B y C) que es natural pensar en probar cada uno de los tres posibles comparaciones de dos grupos (A - B, A - C y B - C) con al prueba.
Pero la ejecución de un conjunto exhaustivo de pruebas t de dos grupos puede ser riesgoso, ya que como el número de grupos aumenta, el número de comparaciones de dos grupos sube aún más. La regla general es que N grupos pueden ser emparejados en N(N - 1) / 2 maneras diferentes, por lo que en un estudio con seis grupos, tendrías 6x5 / 2, o 15 dos comparaciones de grupos diferentes.
Cuando usted hace un montón de pruebas de significación, se corre un mayor riesgo de hacer una Error de tipo I - falsamente concluir importancia cuando no hay efecto real presente. Este tipo de error también se denomina alfa inflación. Así que si quieres saber si un montón de grupos todos tienen medios compatibles o si uno o más de ellos son diferentes de otro u otros, se necesita un soltero prueba de producción de una soltero valor de p que responde a esa pregunta.
El ANOVA de una vía es exactamente ese tipo de prueba. No se ve en las diferencias entre pares de grupo significa- lugar, se analiza cómo la colección entera de grupo significa hacia fuera y lo compara con la cantidad que se podría esperar esos medios para extenderse si todos los grupos se tomaron muestras de la misma población (es decir, si no hubiera verdaderas diferencias entre los grupos).
El resultado de este cálculo se expresa en una prueba estadística llamada Razón F (designada simplemente como F), La relación de la cantidad de variabilidad existe entre los grupos con respecto a lo mucho que hay dentro los grupos.
Si la hipótesis nula es verdadera (en otras palabras, si no existe una verdadera diferencia entre los grupos), entonces la relación F debe ser cercano a 1, y sus fluctuaciones de muestreo debe seguir el Distribución de Fisher F, que es en realidad una familia de funciones de distribución caracterizado por dos números:
Los grados de libertad del numerador: Este número es a menudo designado como dfN o df1, que es uno menos que el número de grupos.
Los grados de libertad del denominador: Este número se designa como dfD o df2, que es el número total de observaciones menos el número de grupos.
El valor p se puede calcular a partir de los valores de F, df1, y df2, y el software realizará este cálculo para usted. Si el valor p de la ANOVA es significativa (menos de 0.05 o su nivel alfa elegido), a continuación, se puede concluir que los grupos son no todos la misma (porque los medios variaron entre sí por una cantidad demasiado grande).