Encuentra los valores atípicos en los datos de infografía

Al analizar los datos para sus infografías, usted debe ser consciente de que algunos puntos de datos - conocido como valores atípicos - sentar hasta ahora fuera de la norma en cuanto a llamar la atención sobre sí mismos. En los casos más graves, incluso pueden sesgar los datos y crear una imagen engañosa de la asignatura. Es necesario reconocer cuando se tiene un valor atípico y luego decidir qué hacer al respecto.

Esta tabla contiene un ejemplo sencillo para demostrar esta idea. Los dos conjuntos de datos representan las calificaciones del estudiante, durante ocho semanas, en dos de exams- semanal los números son el porcentaje de respuestas correctas en el examen. El conjunto de datos a la izquierda (el primer examen) no contiene un valor atípico, pero el conjunto de datos de la derecha (el segundo examen) lo hace. El único valor atípico se muestra en negrita.

Niveles de examen semanales
SemanaGrados (sin valor atípico)Grados (un valor atípico)
190%90%
288%88%
390%90%
485%50%
586%86%
687%87%
785%85%
884%84%
Promedio87%83%

El promedio en la columna central presenta un cuadro bastante exacto de los logros del estudiante en pruebas regulares. El único valor atípico (negrita) (50%) en el conjunto de datos a la derecha lanza una llave en las obras, sin embargo, dejar caer el promedio del estudiante en cuatro puntos porcentuales y sesgar los datos.

¿Qué hace un periodista de datos en un caso así? Aquí están algunas opciones:

  • Tire a la basura el valor atípico. Si estás utilizando sólo el medio en el gráfico y está preocupado de que es engañosa, eliminar el valor atípico como una aberración y luego calcular la media y sin esa semana, como se muestra en la figura.

    En este ejemplo, tirar el valor atípico significaría calificación de la prueba media de este estudiante salta hasta el 87%, lo que (como la primera columna muestra) es una mejor representación de los logros durante el plazo.

    imagen0.jpg

    Si usted va con esta opción, asegúrese de agregar una nota al pie explicando todo: en este caso, la eliminación de un punto de datos. Siempre sea lo más transparente posible.

  • Mostrar los datos tal cual. Ya sea que esté usando sólo la media en su gráfica o trazado de todos los datos en un gráfico, siempre se puede presentar los datos tal y como se trataba de usted, como se muestra en la siguiente figura.

    En este caso, usted debe agregar una nota diciendo en voz alta el valor extremo para que el lector es plenamente consciente de ello.

    image1.jpg
  • Construir un " línea de mejor ajuste ". Esta opción sólo se aplica si usted va a crear un gráfico que muestra todos los datos. Una línea de mejor ajuste - también llamado regresión lineal - es un medio visual de sus datos: literalmente, la línea que representa los puntos de datos dispersos mejor.




» » » » Encuentra los valores atípicos en los datos de infografía