Cómo trazar cuantiles para los subgrupos en r

A menudo desea dividir el análisis de datos para los diferentes subgrupos en I con el fin de compararlas. Tienes que hacer esto si usted quiere saber cómo el tamaño medio de los labios compara entre hombres y gouramis besos femeninos (gran pez por cierto!) O, en el caso de nuestro ejemplo, desea saber si el número de cilindros en un coche influye en el kilometraje.

Por supuesto, usted puede utilizar tapply () para calcular cualquiera de las descriptivos para los subgrupos definidos por una variable de factor. Pero en I a encontrar algunos más herramientas para resumir descriptivos de los diferentes subgrupos.

Una forma de comparar rápidamente los grupos es la construcción de un diagrama de caja y bigotes de los datos. Usted podría construir esta trama mediante el cálculo de la gama, los cuartiles y la mediana para cada grupo, pero por suerte sólo puede decirle R para hacer todo eso para usted. Por ejemplo, si usted quiere saber cómo el kilometraje compara entre los coches con un número diferente de cilindros, sólo tiene que utilizar el diagrama de caja () función:

image0.jpg
> Diagrama de caja (mpg ~ cil, data = coches)

Usted suministra una fórmula simple como el primer argumento diagrama de caja (). Esta fórmula dice lo " cajas de la trama para la variable mpg para los grupos definidos por la variable cil."

Esta parcela utiliza cuantiles para darle una idea de cómo los datos se extendió dentro de cada subgrupo. La línea en el medio de cada caja representa la mediana, y los bordes de la caja representan el primer y el tercer cuartil. Los bigotes se extienden a ya sea el mínimo y el máximo de los datos o 1,5 veces la distancia entre el primer y el tercer cuartil, lo que sea menor.

Para ser completamente correcta, los bordes de la caja representan las bisagras inferior y superior del resumen de cinco números, calculado utilizando la fivenum () función. Son iguales a los cuartiles sólo si tiene un número impar de observaciones en los datos. De lo contrario, los resultados de fivenum () y cuantil () pueden diferir un poco debido a las diferencias en los detalles del cálculo.

Usted puede dejar que los bigotes siempre se extienden hasta el mínimo y el máximo estableciendo la alcance argumento de la diagrama de caja () función para 0.




» » » » Cómo trazar cuantiles para los subgrupos en r