Recogiendo muestras de poblaciones
La idea de muestreo de una población es uno de los conceptos más fundamentales en las estadísticas - de hecho, en toda la ciencia. Por ejemplo, no se puede probar cómo un fármaco de quimioterapia funcionará en todas las personas con cáncer de pulmón por cáncer se puede estudiar solamente una muestra limitada de pacientes con cáncer de pulmón que están disponibles para usted y sacar conclusiones de esa muestra.
Tal como se utiliza en la investigación clínica, los términos población y muestra se puede definir de esta manera:
Población: Todas las personas que tienen un conjunto definido de forma precisa de las características (por ejemplo: humana, masculina, 18-65 años de edad, con la etapa 3 del cáncer de pulmón)
Muestra: Un subconjunto de una población definida, seleccionado para el estudio experimental
Cualquier muestra, no importa lo cuidadosamente que se selecciona, sólo es un reflejo imperfecto de la población, debido a la aparición inevitable de las fluctuaciones de muestreo aleatorio. La figura, que muestra las puntuaciones de CI de una muestra aleatoria de 100 sujetos de la población de Estados Unidos, exhibe esta característica. (Puntuaciones de CI están estandarizados de manera que la media de la población es de 100, con una desviación estándar de 15.)
La muestra se distribuye más o menos igual que la población, pero está claro que es sólo una aproximación a la verdadera distribución. La media y la desviación estándar de la muestra están cerca, pero no exactamente igual a la media y la desviación estándar de la población, y el histograma no tiene una forma de campana perfecto. Estas características son siempre verdad de cualquier muestra aleatoria.
Los histogramas se preparan a partir de datos se observa en la muestra de sujetos, y describen cómo los valores fluctúan en esa muestra. Un histograma de una variable observada, preparado a partir de una muestra aleatoria de los datos, es una aproximación a lo que la verdadera distribución de la población de esa variable se parece.
En un experimento ideales, el muestreo se lleva a cabo de modo que cada miembro de la población tiene la misma probabilidad de ser seleccionado para la muestra experimental. En dicha muestra al azar, solamente inevitables fluctuaciones de muestreo aleatorio, del tipo ilustrado en la figura anterior.
Pero en la mayoría de los experimentos de la vida real, es imposible llevar a cabo un muestreo verdaderamente aleatoria de toda la población. No se puede tratar de reclutar pacientes en estadio 3 con cáncer de pulmón varones adultos de todas partes del mundo, por lo que su muestra es casi seguro que tienen una distribución de raza diferente a la de la población mundial. Esto produce lo que se llama sesgo de muestreo. Si su muestra difiere de la población con respecto a algunas variables que pueden afectar el resultado de su experimento, se puede limitar la aplicabilidad de los resultados de su experimento para la población en general.