¿Cómo hacer un diagrama de caja de un resumen de cinco números

LA diagrama de caja es un gráfico unidimensional de datos numéricos basados ​​en el resumen de cinco números. Este resumen incluye las siguientes estadísticas: el valor mínimo, el percentil 25 (conocido como Q1), La mediana, el percentil 75 (Q3), Y el valor máximo. En esencia, estos cinco estadísticas descriptivas dividen el conjunto de datos en cuatro partes, donde cada parte contiene 25% de los datos.

Para hacer un diagrama de caja, siga estos pasos:

  1. Encuentre el resumen de cinco números del conjunto de datos:

    los mínimo es el valor más pequeño en el conjunto de datos, y la máximo es el valor más grande en el conjunto de datos. Utilice los siguientes pasos para encontrar el percentil 25 (conocido como Q1), El percentil 50 (la mediana), y el 75 por ciento (Q3).

  1. Ordene todos los valores en el conjunto de datos de menor a mayor.

  2. Multiplicar k por ciento veces el número total de valores en los datos, n.

    El resultado se conoce como el índice.

  3. Si el índice obtenido en el paso 2 no es un número entero, redondear hasta el número entero más próximo y vaya al Paso 4a.

    Si el índice obtenido en la Fase 2 es un número entero, vaya al paso 4b.

  4. Elige uno de los siguientes.

    a. Contar los valores de conjunto de datos de izquierda a derecha (desde el más pequeño hasta el mayor valor) hasta llegar al número indicado por el paso 3. El valor correspondiente en el conjunto de datos es la kº percentil.

    b. Contar los valores de conjunto de datos de izquierda a derecha (menor a mayor) hasta llegar al número indicado por el paso 2. El kº percentil es el promedio de ese valor correspondiente de conjunto de datos y el valor que sigue directamente ella.

  • Crear una recta numérica vertical (u horizontal) cuya escala incluye los valores en el resumen de cinco números y usa las unidades apropiadas de la misma distancia unos de otros.

  • Marque la ubicación de cada valor en el resumen de cinco números justo por encima de la recta numérica (para un diagrama de caja horizontal) o justo a la derecha de la recta numérica (para un diagrama de caja vertical).

  • Dibuja un cuadro alrededor de las marcas para el percentil 25 y el percentil 75.

  • Dibuje una línea en el cuadro donde se encuentra la mediana.

  • Determinar si los valores atípicos están presentes.

    Para hacer esta determinación, calcular el rango intercuartil (IQR), que se encuentra restando Q3 - Q1- luego se multiplica IQR por 1,5. Añadir esta cantidad al valor de Q3 y restar esta cantidad del Q1. Esto le da un límite más amplio en torno a la mediana de la caja hace. Todos los puntos de datos que caen fuera de este límite se determina que los valores extremos.

  • Si no hay valores atípicos (de acuerdo a los resultados de la Etapa 6), dibujar líneas de los bordes superior e inferior de la caja fuera de los valores mínimo y máximo del conjunto de datos.

  • Si hay valores atípicos (de acuerdo a los resultados de la Etapa 6), indicar su ubicación en el diagrama de caja con signos *.

    En vez de dibujar una línea desde el borde de la caja todo el camino hasta el valor atípico más extrema, detener la línea en el último valor de los datos que no es un caso atípico.

  • Muchos, si no la mayoría de los paquetes de software indican valores atípicos en un set con un asterisco (*) o símbolo de la estrella y utilizar el procedimiento descrito en el Paso 6 para identificar valores atípicos datos. Sin embargo, no todos los paquetes usan estos símbolos y procedimientos- comprobar para ver lo que hace su paquete antes de analizar sus datos con un diagrama de caja.

    Diagrama de caja de las mejores edades Actriz (1928 -2009- & lt; i>NTV;. / i> = 83 actrices)
    Diagrama de caja de las mejores edades Actriz (1928-2009- n = 83 actrices).

    Un diagrama de caja horizontal para las edades de los mejor actriz ganadores de los premios de la Academia de 1928-2009 se muestra en la figura anterior. Usted puede ver los números de la separación de las secciones de la gráfica de caja coincida con las estadísticas de resumen de cinco números que se muestran en la siguiente figura.

    Estadística descriptiva para Mejores edades Actriz (1928-2009).
    Estadística descriptiva para Mejores edades Actriz (1928-2009).

    Diagramas de caja puede ser vertical (hacia arriba y hacia abajo) con los valores en el eje que va desde la parte inferior (el más bajo) al principio (la más alta) - o pueden ser horizontales, con los valores en el eje que va desde la izquierda (más bajo) a derecha (la más alta ).

    Los pasos que se muestran aquí demuestran una forma de cálculo de la mediana y los cuartiles del resumen de cinco números y de construir el diagrama de caja. Pero hay varios otros métodos aceptables. No sea demasiado alarmado si su calculadora o un amigo le da un diagrama de caja cercana pero diferente de lo que estas medidas darían.




    » » » » ¿Cómo hacer un diagrama de caja de un resumen de cinco números