Cómo colocar valores estadísticos dudosos en un histograma

Cuando se crea un histograma, es necesario dividir el conjunto de datos en grupos separados. Sin embargo, algunos datos estadísticos pueden ser justo en la frontera entre dos grupos. ¿Qué hacer en estas situaciones?

Echa un vistazo a la siguiente tabla que muestra mejores ganadores Actriz Oscar Award entre 1928 y 1935:

Edades de Mejor Actriz Oscar Ganadores del Premio 1928-1935
AñoGanadorAñosPelícula
1,928Laura Gainor22amanecer
1929Mary Pickford37Coquette
1930Norma Shearer30los Divorcee
1.931 milMarie Dressler62Min y Bill
1,932Helen Hayes32El pecado de Madelon Claudet
1933Katharine Hepburn26Gloria de la mañana
1934Collette Colbert31Sucedió una noche
1935Bette Davis27Peligroso

¿Te diste cuenta que la edad de una actriz se encuentra a la derecha en una frontera? Norma Shearer tenía 30 años en 1930 cuando ganó el Oscar a la La divorciada. Ahora, digamos que dividir los grupos de edad en el histograma en segmentos de 5 años (20-25, 25-30, 30-35, y así sucesivamente). ¿Le colocarla en el grupo de 25-30 años de edad (la barra inferior) o el grupo de edad 30 a 35 (la barra superior)?

Siempre y cuando sean compatibles con todos los puntos de datos, puede poner todos los puntos dudosos en sus respectivas barras inferiores o poner todos ellos en sus respectivas barras superiores. Lo importante es elegir una dirección y ser coherente.

imagen0.jpg

El histograma en este ejemplo fue con la convención de poner todos los valores límite en sus respectivas barras superiores - que pone a la edad de Norma Shearer en la tercera barra, el grupo de 30 a 35 años de edad el histograma. Es una práctica común para hacer los intervalos de barras izquierda inclusiva (es decir, las barras incluyen el punto final izquierdo pero no el derecho), al igual que este ejemplo histograma hace. Por lo tanto, esta barra contiene la edad de 30, pero no 35.




» » » » Cómo colocar valores estadísticos dudosos en un histograma