Cómo probar la normalidad de datos de una manera formal en r

Los métodos gráficos para comprobar la normalidad de datos en I todavía dejan mucho que su propia interpretación. Hay mucha discusión en el mundo estadística sobre el significado de estas parcelas y lo que puede ser visto como normal.

Si muestra alguna de estas parcelas a diez estadísticos diferentes, puede obtener diez respuestas diferentes. Eso es todo un logro cuando se espera un simple sí o no, pero los estadísticos no hacen respuestas simples.

Por el contrario, todo lo que en las estadísticas gira en torno a la medición de la incertidumbre. Esta incertidumbre se resume en una probabilidad - a menudo llamado un p-valor - y calcular esta probabilidad, se necesita una prueba formal.

Probablemente la prueba más utilizada para la normalidad es la prueba de Shapiro-Wilks. La función para realizar esta prueba, convenientemente llamado shapiro.test (), no podría ser más fácil de usar. Usted da la muestra como el único argumento, como en el siguiente ejemplo:

> Shapiro.test (beaver2 $ temp) Shapiro-Wilks normalidad testdata: beaver2 $ tempW = 0,9334, p-valor = 7.764e-05

Esta función devuelve un objeto de la lista, y el valor de p está contenido en un elemento llamado Valor PD. Así, por ejemplo, puede extraer el valor de p, simplemente usando el siguiente código:

> Resultado lt; - shapiro.test (beaver2 $ temp)> Resultado de $ Valor PD [1] 7.763782e-05

Este valor p te dice lo que lo más probable es que la muestra proviene de una distribución normal. Cuanto menor sea este valor, menor será la probabilidad. Los estadísticos suelen utilizar un valor de 0,05 como punto de corte, por lo que cuando el valor de p es menor que 0.05, se puede concluir que la muestra se desvía de la normalidad.

En el ejemplo anterior, el valor de p es claramente inferior a 0,05 - y eso no debería ser una sorpresa- la distribución de la temperatura muestra dos picos separados. Esto es nada como la curva de la campana de una distribución normal.

Cuando usted elige una prueba, puede estar más interesado en la normalidad en cada muestra. Puede probar ambas muestras en una línea utilizando el tapply () función, así:

> Con (castor, tapply (temperatura, activ, shapiro.test)

Este código devuelve los resultados de una prueba de Shapiro-Wilks de la temperatura para cada grupo especificado por la variable de activ.

La gente a menudo se refieren a la prueba de Kolmogorov-Smirnov para las pruebas de normalidad. Usted lleva a cabo la prueba mediante el uso de la ks.test () función en base de R. Pero esta función R no es adecuado para probar desviación de normality- se puede utilizar sólo para comparar diferentes distribuciones.




» » » » Cómo probar la normalidad de datos de una manera formal en r