Cómo utilizar parcelas cuantiles para comprobar la normalidad de datos en r

Histogramas dejan mucho a la interpretación del espectador. Una mejor manera gráfica en I de saber si sus datos se distribuyen normalmente es mirar a la llamada cuantil-cuantil (QQ) trama.

Con esta técnica, se trazan cuantiles uno contra el otro. Si se comparan dos muestras, por ejemplo, sólo tiene que comparar los cuantiles de ambas muestras. O, para decirlo de manera un poco diferente, R hace lo siguiente para la construcción de una parcela QQ:

  • Se ordena los datos de ambas muestras.

  • Traza estos valores ordenados el uno contra el otro.

Si ambas muestras no contienen el mismo número de valores, R calcula los valores adicionales por interpolación para la muestra más pequeña para crear dos muestras del mismo tamaño.

Cómo comparar dos muestras de datos

Por supuesto, usted no tiene que hacerlo todo por ti mismo, sólo tiene que utilizar el qqplot () función para eso. Así que, para comprobar si las temperaturas durante la actividad y durante el resto se distribuyen por igual, sólo tiene que hacer lo siguiente:

> Qqplot (beaver2 $ temp [beaver2 $ activ == 1], + beaver2 $ temp [beaver2 $ activ == 0])

Esto crea una parcela donde los valores ordenados se trazan unos contra otros.

image0.jpg

Entre los corchetes, puede utilizar un vector lógico para seleccionar los casos que desee. Aquí selecciona todos los casos en los que la variable activ es igual a 1 para la primera muestra, y todos los casos en que esa variable es igual a 0 para la segunda muestra.

Cómo utilizar una parcela R QQ para comprobar la normalidad de datos

En la mayoría de los casos, usted no desea comparar dos muestras entre sí, pero comparar una muestra con una muestra teórica de que proviene de una cierta distribución (por ejemplo, la distribución normal).

Para que una parcela QQ esta manera, R tiene el especial qqnorm () función. Como su nombre lo indica, esta función dibuja su muestra en contra de una distribución normal. Simplemente da la muestra que desea trazar como primer argumento y añadir los parámetros gráficos que te gusta.

R crea entonces una muestra con valores procedente de la estándar distribución normal, o una distribución normal con una media de cero y una desviación estándar de uno. Con esta segunda muestra, R crea la trama QQ como se ha explicado antes.

R también tiene una qqline () función, lo que añade una línea a su parcela normal de QQ. Esta línea hace que sea mucho más fácil de evaluar si usted ve una clara desviación de la normalidad. Cuanto más cerca de todos los puntos se encuentran a la línea, más cerca de la distribución de la muestra viene a la distribución normal. los qqline () función también toma la muestra como un argumento.

Ahora quiere hacer esto por las temperaturas durante tanto el activo y el período de inactividad del castor. Puede utilizar el qqnorm () funcionar dos veces para crear las dos parcelas. Para los períodos inactivos, puede utilizar el siguiente código:

> Qqnorm (beaver2 $ temp [beaver2 $ activ == 0], principales = 'Inactivo')> qqline (beaver2 $ temp [beaver2 $ activ == 0])

Usted puede hacer lo mismo para el período activo cambiando el valor 0 a 1.

image1.jpg


» » » » Cómo utilizar parcelas cuantiles para comprobar la normalidad de datos en r