¿Cómo interpretar la desviación estándar de un conjunto de datos estadísticos
La desviación estándar puede ser difícil de interpretar como un solo número por sí solo. Básicamente, una pequeña desviación estándar significa que los valores de un conjunto de datos estadísticos se encuentran cerca de la media del conjunto de datos, en promedio, y una desviación estándar grande significa que los valores en el conjunto de datos están más lejos de la media, en promedio .
Las medidas estándar de desviación cómo concentran los datos son en todo el significado de la más concentrada, menor es la desviación estándar.
Una desviación estándar pequeña puede ser una meta en ciertas situaciones en las que los resultados están restringidos, por ejemplo, en la fabricación de productos y control de calidad. Un tipo particular de pieza del coche que tiene que ser de 2 centímetros de diámetro para encajar adecuadamente mejor no había una desviación estándar muy grande durante el proceso de fabricación. Una desviación estándar grande en este caso significaría que un montón de piezas terminan en la basura porque no se ajustan a derecho; eso o los coches tendrá problemas en el futuro.
Sin embargo, en situaciones en las que sólo observar y registrar datos, una desviación estándar grande no es necesariamente una mala cosa: sólo refleja una gran cantidad de variación en el grupo que se encuentra en estudio. Por ejemplo, si nos fijamos en los salarios de todos los miembros de una determinada empresa, incluyendo a todos, desde el estudiante en prácticas para el director general, la desviación estándar puede ser muy grande. Por otra parte, si a optimizar el grupo por mirar sólo a los estudiantes internos, la desviación estándar es menor, debido a que los individuos dentro de este grupo tienen salarios que son menos variables. El segundo conjunto de datos no es mejor, es apenas menos variable.
Similar a la media, los valores atípicos afectan a la desviación estándar (después de todo, la fórmula para la desviación estándar incluye la media). He aquí un ejemplo: los sueldos de los Lakers de Los Ángeles en la gama de la temporada 2009-2010 de la más alta, $ 23.034.375 (Kobe Bryant) hasta $ 959.111 (Didier Ilunga-Mbenga y Josh Powell). Un montón de variaciones, para estar seguro! La desviación estándar de los sueldos para este equipo resulta ser $ 6,567,405- es casi tan grande como la media. Sin embargo, como se puede adivinar, si quita el sueldo de Kobe Bryant a partir del conjunto de datos, la desviación estándar disminuye porque los salarios restantes están más concentradas alrededor de la media. La desviación estándar se convierte en $ 4.671.508.
Aquí hay algunas propiedades que pueden ayudar a la hora de interpretar una desviación estándar:
La desviación estándar nunca puede ser un número negativo, debido a la forma en que se calcula y el hecho de que mide una distancia (distancias nunca son números negativos).
El menor valor posible para la desviación estándar es de 0, y que sólo ocurre en situaciones artificiales donde cada número individual en el conjunto de datos es exactamente el mismo (sin desviación).
La desviación estándar se ve afectada por los valores extremos (muy bajos o muy altos números en el conjunto de datos). Esto se debe a la desviación estándar se basa en la distancia desde el significar. Y recuerde, la media también se ve afectada por los valores extremos.
La desviación estándar tiene las mismas unidades que los datos originales.