Tendencia central: allá de lo básico

La media y la mediana son las dos medidas más fiables y comúnmente reportados del centro, y se utilizan en una amplia variedad de situaciones. Sin embargo, si usted está estudiando seriamente estadísticas, usted debe estar familiarizado con las otras dos medidas de tendencia central.

Modo

los modo es otra medida de centro que calcula qué valor (o intervalo de valores) se produce con más frecuencia. La media y la mediana pueden ser muy eficaces en la descripción de las distribuciones simétricas y unimodales. El modo es útil para explicar las situaciones que la media y la mediana pueden los datos no, especialmente sesgadas o multimodales.

Para calcular el modo, sólo tiene que crear una tabla de frecuencias de todos los valores posibles y contar el número de veces que cada aparece. Por ejemplo, si el conjunto de datos contiene 10, 20, 20, 20, 30, 30, 40, 50, 50 y luego el modo es 20.

Si usted tiene un conjunto de datos que no tienen valores que se repiten exactamente, se puede dividir en rangos similares a la forma en que se prepara para hacer un histograma. Por ejemplo, en la siguiente tabla, dos jugadores de los Lakers están haciendo el mínimo de la liga de la NBA, por lo que el modo podrían ser considerados como $ 959.111. Alternativamente, usted podría dividir los datos en grupos de $ 1 millón, en cuyo caso el modo sería el rango de $ 5-6 million porque cuatro jugadores caen en ese grupo.

Los sueldos de los Los Ángeles Lakers de la NBA Jugadores (2009-2010)
JugadorSalario ($)
Kobe Bryant23034375
Pau Gasol16452000
Andrew Bynum12526998
Lamar Odom7500000
Ron Artest5854000
Adam Morrison5,257,229
Derek Fisher5,048,000
Sasha Vujacic5000000
Luke Walton4,840,000
Shannon Brown2000000
Jordan Farmar1,947,240
Didier Ilunga-Mbenga959.111
Josh Powell959.111
Cantidad91378064

El modo puede ser visualizado por el pico en un histograma. Con los conjuntos de datos que tienen varios picos, no es raro reportar múltiples modos porque la media y la mediana pueden no reflejar exactamente donde la mayoría de los valores se encuentran.

Media truncada

Ya has visto que la media es susceptible a los valores atípicos y estará " sacó " hacia los valores más extremos. los Media Truncada (o media truncada) Trata de eliminar la influencia de los valores atípicos mediante el recorte de un pequeño número de valores extremos por lo que la media se centra más en los valores más centrales.

Para calcular un recortado media, elige un pequeño porcentaje de sus datos establecido (por ejemplo, 10 por ciento), dividir ese número por la mitad, quitar el porcentaje correspondiente de valores de ambos los extremos inferior y superior, y luego calcular la media de los restantes los valores.

Por ejemplo, supongamos que un conjunto de datos contiene la siguiente n = 20 valores: 3, 3, 3, 3, 4, 4, 4, 4, 4, 4, 5, 5, 5, 6, 6, 6, 7, 7, 9, 500. El valor de 500 unidades de valor atípico la muestra (tradicional) significa ser 29.6, que es más grande que todos menos uno de los valores de datos y no es realmente indicativo de donde está toda la acción.

En su lugar, se puede cortar el más extremo el 10 por ciento, lo que significa la eliminación de dos valores (10% x 20 = 20), y acaba de calcular un promedio en base a la media del 90 por ciento de los valores. Ya que tienes que dividir que dos entre los dos extremos, podrás eliminar uno de la gama baja (3) y uno de la gama alta (500). El 90 por ciento de media recortada basa en los valores de los datos 18 restantes es 4.9 y refleja mejor la tendencia central de los datos.




» » » » Tendencia central: allá de lo básico