Los diagramas de caja: técnica gráfica de datos estadísticos

LA diagrama de caja está diseñado para mostrar varias estadísticas clave para un conjunto de datos en forma de un rectángulo vertical o caja. Las estadísticas que puede mostrar incluyen los siguientes:

  • Valor mínimo

  • Valor máximo

  • En primer cuartil (Q1)

  • En segundo cuartil (Q2)

  • En tercer cuartil (Q3)

  • Rango intercuartil (IQR)

los primer cuartil de un conjunto de datos es una medida numérica que divide los datos en dos partes: el 25 por ciento más pequeña de las observaciones y el más grande 75 por ciento de las observaciones. En otras palabras, el primer cuartil es un valor numérico con las siguientes propiedades:

  • 25 por ciento de las observaciones en el conjunto de datos son mas pequeño que el primer cuartil.

  • 75 por ciento de las observaciones en el conjunto de datos son mas grande que el primer cuartil.

Del mismo modo, la segundo cuartil (también conocido como el mediana) Divide los datos en un medio, por lo que 50 por ciento de los elementos son más pequeños que la mediana, y 50 por ciento son más grandes.

los tercer cuartil es el valor para el que se cumplen los siguientes:

  • 75 por ciento de las observaciones en el conjunto de datos son mas pequeño que el tercer cuartil.

  • 25 por ciento de las observaciones en el conjunto de datos son mas grande que el tercer cuartil.

los rango intercuartílico (RIC) es la diferencia entre el tercer cuartil y primer cuartil: IQR = Q3 - Q1.

El rango intercuartil es una medida de dispersión- que muestra la cantidad de dispersión que existe entre los elementos en el 50 por ciento de un conjunto de datos.

Un diagrama de caja se dibuja de manera que

  • La parte superior del cuadro representa la tercer cuartil (Q3) De los datos.

  • La parte inferior de la caja representa la primer cuartil (Q1) De los datos.

  • El centro de la caja (que se muestra con una línea) representa la segundo cuartil (Q2).

Además, hay una línea arriba la casilla para indicar la máximo valor en los datos que no exceda de Q3 + 1,5 x RIC y una línea abajo la casilla para indicar la mínimo valor en los datos que no caiga por debajo de Q1 - 1,5 x RIC. Los valores fuera de este rango son valores atípicos y se muestran en el gráfico de caja como puntos individuales.

Esta figura muestra un diagrama de caja de los precios diarios de las acciones de Microsoft desde enero 1ro, 2013-diciembre 31ro, 2013.

Caja parcela de precios diarios de las acciones de Microsoft.
Caja parcela de precios diarios de las acciones de Microsoft.

No hay valores atípicos en estos datos. Por lo tanto, la línea de fondo en el diagrama de caja muestra que el precio más bajo durante este período fue de algo menos de $ 26.00, y la línea superior muestra que el precio más alto fue de poco más de $ 38. La parte inferior del cuadro se corresponde con el primer cuartil, que es de $ 27.43- la línea continua en el medio del cuadro corresponde al segundo cuartil (la mediana), que es $ 31.89. La parte superior del cuadro se corresponde con el tercer cuartil, que es $ 33.78. La altura de la caja es igual al rango intercuartílico (RIC), que es de $ 6.35.

Como otro ejemplo, esta cifra muestra un diagrama de caja de los precios diarios de las acciones de Apple a partir en 1, 2013-dic 31, 2013.

Caja parcela de precios diarios de las acciones de Apple de 1 en. 2013-31 dic. 2013.
Caja parcela de precios diarios de las acciones de Apple de 1 en. 2013-31 dic. 2013.

El precio más bajo en el año 2013 para las acciones de Apple era $ 53.84, y el precio más alto fue de $ 80.11. No hay valores atípicos en los datos, por lo que estos valores se muestran en la línea inferior y la línea superior, respectivamente.

El primer cuartil, que se muestra en la parte inferior de la caja, era $ 60.48. El segundo cuartil fue $ 63,65 (se muestra por la línea de color negro sólido) y el tercer cuartil fue $ 70.32, que se muestra en la parte superior de la caja. Como resultado, el rango intercuartil (IQR) es de $ 9.84.




» » » » Los diagramas de caja: técnica gráfica de datos estadísticos