Cómo grupo de datos estadística apropiadamente en un histograma
Cuando se crea un histograma, es importante grupo de los conjuntos de datos en rangos que permiten ver patrones significativos en sus datos estadísticos. Por ejemplo, digamos que usted quiere ver si actrices que han ganado un premio de la Academia eran probable que sea dentro de un cierto rango de edad.
La siguiente imagen muestra un histograma de edades Mejores ganadores Actriz Premios de la Academia "entre 1928 y 2009.
Esta imagen muestra grupos de 5 años cada uno, ya incrementos de 5 crear pausas naturales para el año y porque proporciona suficientes bares para buscar patrones generales. Por ejemplo, se puede ver que la mayoría de los ganadores, alrededor del 68 por ciento, estaban entre las edades de 25 y 40 años, con un pico definido entre las edades de 30 y 35.
Tenga en cuenta que usted no tiene que utilizar este grouping- particular que usted tiene un poco de flexibilidad a la hora de hacer un histograma. Estos son algunos consejos útiles:
Cada conjunto de datos requiere diferentes rangos de sus agrupaciones, pero desea evitar rangos que son demasiado ancha o demasiado estrecha.
Si un histograma tiene rangos muy amplios por sus grupos, que coloca todos los datos en un número muy pequeño de barras que hacen comparaciones significativas imposible.
Si el histograma tiene rangos muy estrechos por sus grupos, se ve como una gran serie de pequeños bares que nublan el panorama. Esto puede hacer que los datos se ven muy entrecortado sin un patrón real.
Asegúrese de que sus grupos tienen la misma anchura. Si una barra es más ancha que las otras, ésta puede contener más datos que debería.
Una solución que puede ser apropiado para su histograma es tomar el rango de los datos (más grande, menos el más pequeño) y se divide por 10 para obtener 10 agrupaciones.
¿Qué pasa si un ganador tiene 30 años? ¿Ella pertenece a 25-30 o 30-35? Siempre y cuando sean compatibles con todos los puntos de datos, puede poner todos los puntos dudosos en sus respectivas barras inferiores o poner todos ellos en sus respectivas barras superiores. Lo importante es elegir una dirección y ser coherente. Es una práctica común para hacer los intervalos de barras izquierda inclusiva (es decir, las barras incluyen el punto final izquierdo pero no el derecho).