Cómo gráficos pueden distorsionar las estadísticas

Un gráfico estadístico le puede dar una imagen falsa de las estadísticas sobre el que se basa. Por ejemplo, se puede inducir a error a través de su elección de la escala en el eje de frecuencias de frecuencia / relativos (es decir, el eje donde se informan las cantidades en cada grupo), y / o su valor inicial.

Mediante el uso de una escala "estirado" (por ejemplo, que cada media pulgada de una barra representa 10 unidades en comparación con 50 unidades), se puede estirar la verdad, hacen diferencias parecen más dramática, o exageran valores. Verdad-estiramiento también puede ocurrir si el eje de frecuencia comienza en un número que está muy cerca de donde las diferencias en las alturas de las barras que arranque son, en esencia, cortando la parte inferior de las barras (la parte menos interesante) y simplemente mostrando la parte de arriba, haciendo hincapié (de una manera engañosa) donde está la acción. No todos eje de frecuencia tiene que empezar de cero, pero ten cuidado con las situaciones que elevan las diferencias.

He aquí un buen ejemplo de un gráfico con una escala extendida:

La Lotería de Kansas muestra rutinariamente sus resultados recientes de la Pick 3 lotería. Una de las estadísticas reportadas es el número de veces que cada número (del 0 al 9) se dibuja entre los tres números ganadores. La tabla muestra un gráfico del número de veces que cada número se redactó durante 1613 total de Pick 3 juegos (4.839 números individuales dibujados). Asimismo, se informa que el porcentaje de veces que se ha elaborado cada número. Dependiendo de cómo usted elige para mirar estos resultados, puede hacer que las estadísticas parecen contar historias muy diferentes.

Números sorteados en el Pick 3 lotería
Número DibujadoNº de veces Drawn de 4839Porcentaje de veces Drawn (Nº de veces Drawn dividir-4839)
048510,0%
14689,7%
251310,6%
349110,1%
448410,0%
54809,9%
648710,1%
748210,0%
84759,8%
94749,8%

La forma en que las loterías suelen mostrar resultados como los de la tabla se muestra en el gráfico superior en la siguiente imagen.

Los gráficos de barras que muestran un número) de veces que cada número era drawn- y b) el porcentaje de veces que cada número
Los gráficos de barras que muestran un número) de veces que cada número era drawn- y b) el porcentaje de veces que cada número se elaboró.

Observe que en esta gráfica, parece que el número 1 no quede dibujado con tanta frecuencia (sólo 468 veces) como el número 2 hace (513 veces). La diferencia en la altura de estos dos barras parece ser muy grande, exagerar la diferencia en el número de veces que estos dos números se extrajeron. Sin embargo, para poner esto en perspectiva, la diferencia real aquí es 513-468 = 45 de un total de 4.839 números sorteados. En términos de porcentajes, la diferencia entre el número de veces que el número 1 y el número 2 se dibujan es 45 # 247- 4839 = 0.009, o sólo nueve décimas de uno por ciento (0.009 x 100% = 0,9%).

¿Por qué el gráfico superior de la imagen hecha de esta manera? Podría llevar a la gente a pensar que tienen un borde interior si eligen el número 2 porque es "en una buena racha" - o puede ser que se llevó a elegir el número 1 porque es "por llegar." Ambas teorías son erróneas, por cierto- porque los números son elegidos al azar, lo que sucedió en el pasado no importa. El gráfico inferior de la figura se ha realizado correctamente.




» » » » Cómo gráficos pueden distorsionar las estadísticas