El teorema del límite central: lo que es lo suficientemente grande
En pocas palabras, el teorema del límite central dice que usted puede utilizar la distribución normal para describir el comportamiento de una media muestral incluso si los valores individuales que componen la media de la muestra no son normales sí mismos. Pero esto sólo es posible si el tamaño de la muestra es " lo suficientemente grande ". Muchos libros de texto de estadística que le dirían que n
tendría que ser al menos 30.Pero ¿por qué es n = 30 el punto de referencia? Muchas variables en la naturaleza, las finanzas y otras aplicaciones tienen una distribución que está muy cerca de la curva normal. Por ejemplo, observando la t-tabla, vemos que los diversos valores de t comenzará a llegar muy cerca de los valores de z en el momento de llegar a unos 30 grados de libertad. Una razón para esto es que la t-distribuciones y los comparten dos características importantes normales de distribución: Ellos son simétricas, y son unimodal (que tiene un pico).
Si la distribución de sus valores de datos individuales está muy lejos de cualquiera de estas cualidades, es posible que necesite más de un tamaño de muestra de 30 a utilizar el teorema del límite central. Cuanto más lejos los datos es de ser simétrica y unimodal, más datos que usted necesita.
Simetría
Si usted sabe o sospecha que su distribución original no es simétrica respecto a la media, entonces es posible que tenga un tamaño de muestra que es significativamente mayor que 30 para obtener la posible muestra significa mirar normal (y por lo tanto utilizar el teorema del límite central).
Considere el siguiente derecho; histograma sesgada, que registra el número de mascotas por familia.
Ahora, supongamos que representa a toda la población de los hogares. Usted repetidamente muestra n = 30 hogares de esa población. Esto es lo que la distribución de posibles medias muestrales se parece.
Se puede ver que esta distribución no es normal porque la cola derecha todavía se extiende más lejos del pico central de la cola izquierda hace. No es simétrica. Para esta población, es necesario tomar una muestra de alrededor de n = 100 para obtener la muestra significa que conformarse en una curva simétrica.
Unimodal
Si usted sabe o sospecha que su distribución original no es unimodal y tiene más de un pico, entonces puede que tenga más de 30 en la muestra para sentirse bien sobre el uso del teorema del límite central.
Considere el siguiente histograma población multimodal con tres picos distintos.
Si sólo se muestra n = 30 de esa población, usted consigue una distribución unimodal, pero todavía no es del todo simétrica.
Para esta población, lo que necesita para tomar una muestra de al menos n = 50 para estar seguro de que su media muestral distribución es más o menos normal.