Cómo colocar valores estadísticos dudosos en un histograma
Cuando se crea un histograma, es necesario dividir el conjunto de datos en grupos separados. Sin embargo, algunos datos estadísticos pueden ser justo en la frontera entre dos grupos. ¿Qué hacer en estas situaciones?
Echa un vistazo a la siguiente tabla que muestra mejores ganadores Actriz Oscar Award entre 1928 y 1935:
Año | Ganador | Años | Película |
---|---|---|---|
1,928 | Laura Gainor | 22 | amanecer |
1929 | Mary Pickford | 37 | Coquette |
1930 | Norma Shearer | 30 | los Divorcee |
1.931 mil | Marie Dressler | 62 | Min y Bill |
1,932 | Helen Hayes | 32 | El pecado de Madelon Claudet |
1933 | Katharine Hepburn | 26 | Gloria de la mañana |
1934 | Collette Colbert | 31 | Sucedió una noche |
1935 | Bette Davis | 27 | Peligroso |
¿Te diste cuenta que la edad de una actriz se encuentra a la derecha en una frontera? Norma Shearer tenía 30 años en 1930 cuando ganó el Oscar a la La divorciada. Ahora, digamos que dividir los grupos de edad en el histograma en segmentos de 5 años (20-25, 25-30, 30-35, y así sucesivamente). ¿Le colocarla en el grupo de 25-30 años de edad (la barra inferior) o el grupo de edad 30 a 35 (la barra superior)?
Siempre y cuando sean compatibles con todos los puntos de datos, puede poner todos los puntos dudosos en sus respectivas barras inferiores o poner todos ellos en sus respectivas barras superiores. Lo importante es elegir una dirección y ser coherente.
El histograma en este ejemplo fue con la convención de poner todos los valores límite en sus respectivas barras superiores - que pone a la edad de Norma Shearer en la tercera barra, el grupo de 30 a 35 años de edad el histograma. Es una práctica común para hacer los intervalos de barras izquierda inclusiva (es decir, las barras incluyen el punto final izquierdo pero no el derecho), al igual que este ejemplo histograma hace. Por lo tanto, esta barra contiene la edad de 30, pero no 35.