Cómo detectar la variabilidad estadística en un histograma

Usted puede tener una idea de la variabilidad en un conjunto examinado su histograma de datos estadísticos. Por ejemplo, si los datos son todos iguales, todos ellos están colocados en una sola barra, y no hay variabilidad. Si una cantidad igual de datos está en cada uno de varios grupos, el histograma se ve plano con las barras cerca de la misma en altura esto señala una buena cantidad de variabilidad.

La idea de un histograma plana que indica cierta variabilidad puede ir en contra de su intuición, y si lo hace no está solo. Si estás pensando en un histograma plana significa que no hay variabilidad, probablemente estás pensando en un gráfico de tiempo, donde los números individuales se trazan a través del tiempo. Recuerde, sin embargo, que un histograma no muestra los datos a través del tiempo - que muestra todos los datos en un momento en el tiempo. Desde el histograma es plano, lo que significa que los datos están distribuidos en todo el espectro, por lo tanto, una alta variabilidad.

Igualmente interesante es la idea de que un histograma con un gran nudo en el medio y las colas en pendiente muy por debajo de cada lado en realidad tiene menos variabilidad que un histograma que es en línea recta. Las curvas que parecían colinas en un histograma representan grupos de datos que están muy juntos, por lo tanto una baja variabilidad.

La variabilidad en un histograma es mayor cuando las barras altas están más repartidos lejos de la media y la inferior cuando las barras más altas se encuentran cerca de la media.

imagen0.jpg

Para edades de los Premios de la Academia Mejor Actriz ganadores que se muestran en la figura anterior, se ve muchas actrices están en el rango de edad 30 a 35, y la mayoría de las actrices tiene entre 20-50 años de edad, lo cual es bastante Diverso- entonces tener esos valores extremos, esas pocas actrices de más edad (7 de ellos) que se propagan los datos fuera más lejos, el aumento de la variabilidad total de los datos.

El estadístico más utilizado para medir la variabilidad de un conjunto de datos es la desviacion estandar, que en cierto sentido bruto mide la distancia "media" o "típico" que la mentira de datos de la media. La desviación estándar de los datos de Mejor Actriz edad es 11,35 años. Una desviación estándar de 11,35 años es bastante grande en el contexto de este problema, pero la desviación estándar se basa en la distancia promedio de la media, y la media se ve influenciada por los valores atípicos, por lo que la desviación estándar se verá influida también.




» » » » Cómo detectar la variabilidad estadística en un histograma