El método de arranque de los errores estándar y los intervalos de confianza

Usted puede calcular el error estándar (SE) y el intervalo de confianza (IC) de las estadísticas de la muestra más comunes (medias, proporciones, recuentos de eventos y tarifas, y coeficientes de regresión). Pero una SE y CI existen (teóricamente, al menos) para alguna número de lo que pueda extraer de sus datos - medianas, percentiles, los coeficientes de correlación y otras cantidades que puedan involucrar cálculos complicados, como el área bajo la curva de concentración-contra-tiempo (AUC) o estimado la probabilidad de supervivencia a cinco años derivada de un análisis de supervivencia. Fórmulas para la SE y CI en torno a estos números podrían no estar disponibles o podrían ser irremediablemente difíciles de evaluar. Además, las fórmulas que existen podrían aplican sólo a los números de distribución normal, y es posible que no sea seguro de qué tipo de distribución sigue sus datos.

Considere un problema muy simple. Supongamos que usted ha medido el coeficiente intelectual de 20 sujetos y se han conseguido los siguientes resultados: 61, 88, 89, 89, 90, 92, 93, 94, 98, 98, 101, 102, 105, 108, 109, 113, 114 , 115, 120 y 138. Estos números tienen una media de 100,85 y una mediana de 99,5. Porque eres un buen científico, ya sabes que siempre que usted reporta algún número que haya calculado a partir de los datos (como una media o mediana), también querrá indicar la precisión de que el valor en forma de una SE y CI.

Para la media, y si se puede asumir que los valores de CI se distribuyen aproximadamente normal, las cosas son bastante simples. Se puede calcular la SE de la media como 3,54 y el IC del 95% alrededor de la media como 93,4 a 108,3.

Pero ¿qué pasa con la SE y CI para la mediana, para los que no hay fórmulas simples? ¿Y si usted no puede estar seguro de los valores del índice de inteligencia provienen de una distribución normal? A continuación, las fórmulas simples podrían no ser confiables.

Afortunadamente, hay un método muy general para la estimación de las PE y los IC para cualquier cosa que usted puede calcular a partir de sus datos, y que no requiere ninguna hipótesis sobre cómo se distribuyen sus números. El SE de cualquier estadística de la muestra es la desviación estándar (DE) de la distribución muestral de esa estadística. Y los límites de confianza del 95% de una muestra estadística son muy aproximadas por la 2,5º y percentiles 97,5 de la distribución muestral de esa estadística.

Así que si usted podría replicar todo el experimento muchas miles de veces (utilizando una muestra diferente de temas cada vez), y cada Calcular tiempo y guardar el valor de la cosa que le interesa (mediana, AUC, o lo que sea), esta colección de miles de valores sería una muy buena aproximación a la distribución muestral de la cantidad de interés. Posteriormente, se podría estimar la SE simplemente como la desviación estándar de la distribución muestral y los límites de confianza de los percentiles de la distribución.

Pero en realidad llevar a cabo este escenario no es posible - es probable que no tiene el tiempo, la paciencia, o el dinero para llevar a cabo la totalidad de sus miles de estudio de tiempos. Afortunadamente, usted no tiene que repetir el estudio miles de veces para obtener una estimación de la distribución muestral. Puede hacerlo mediante la reutilización de los datos de su un estudio real, una y otra vez! Esto puede sonar demasiado bueno para ser verdad, y los estadísticos eran muy escépticos de este método cuando se propuso por primera vez. Lo llamaron bootstrapping, comparándolo con la imposible tarea de " recoger a ti mismo por sus propios esfuerzos ".

Pero resulta que si se mantiene la reutilización de los mismos datos de cierta manera, este método realmente funciona. Con los años, el procedimiento de arranque se ha convertido en una forma aceptada para obtener estimaciones fiables de las PE y los IC para casi cualquier cosa se puede calcular a partir de datos de la realidad, a menudo se considera que es el " de oro estándar " contra el que son juzgados diversas fórmulas de aproximación para las PE y los IC.

Para ver cómo funciona el método de arranque, así es como se usaría para estimar la SE y IC del 95% de la media y la mediana de los valores de CI 20 mostrados anteriormente. Tienes que resample sus 20 números, una y otra vez, de la siguiente manera:

  1. Escriba cada una de sus medidas en una hoja de papel aparte y poner a todos en una bolsa.

    En este ejemplo, usted escribe los 20 CI medidos en pedazos separados.

  2. Meter la mano y sacar un resbalón, escribir ese número, y poner el deslizamiento en la bolsa.

    (Esta última parte es muy importante!)

  3. Repita el paso 2 tantas veces como sea necesario para que coincida con el número de medidas que usted tiene, devolviendo el deslizamiento a la bolsa cada vez.

    Esto se llama remuestreo con replacemeNuevo Testamento, y produce una remuestreada conjunto de datos. En este ejemplo, se repite el paso 2 más 19 veces, para un total de 20 veces (que es el número de mediciones del índice de inteligencia que tiene).

  4. Calcula el estadístico muestra deseada de los números resampled de los pasos 2 y 3, y anote ese número.

    En este ejemplo, se encuentra la media y la mediana de los 20 números resampled.

  5. Repita los pasos 2 a 4 miles de veces.

    Cada vez, generar estableció un nuevo remuestreada datos desde la que calcular y registrar las estadísticas de la muestra deseado (en este caso, la media y la mediana del conjunto de datos remuestreada). Terminas con miles de valores de la media y de miles de valores de la mediana.

    En cada conjunto de datos remuestreada, algunos de los valores originales pueden ocurrir más de una vez, y algunos pueden no estar presentes en absoluto. Casi cada conjunto de datos remuestreada será diferente de todos los demás. El método de arranque se basa en el hecho de que estos significan y valores de la mediana de los miles de conjuntos de datos resampled comprenden una buena estimación de la distribución de muestreo para la media y la mediana. En conjunto, se asemejan al tipo de resultados que mayo haber conseguido si se hubiera repetido el estudio real y otra vez.

  6. Calcula la desviación estándar de sus miles de valores de la estadística muestra.

    Este proceso le da una " bootstrap " estimación de la SE de la estadística muestra. En este ejemplo, se calcula la desviación estándar de los miles de medios para obtener el SE de la media, y se calcula la desviación estándar de los miles de medianas para obtener el SE de la mediana.

  7. Obtener la 2,5º y percentiles 97,5 de los miles de valores de la estadística muestra.

    Para ello, la clasificación de sus miles de valores de la estadística de la muestra en orden numérico, y luego cortarle el 2,5 por ciento más bajo y el 2,5 por ciento más alto de la serie ordenada de números. Los valores mínimos y máximos que quedan son la estimación bootstrap de 95% los límites bajos y altos de confianza para la estadística de la muestra.

    En este ejemplo, el 2,5º y percentiles 97,5 de las medias y medianas de los miles de conjuntos de datos resampled son los límites de confianza del 95% para la media y la mediana, respectivamente.

Obviamente que nunca lo intentas hacer este proceso de bootstrapping a mano, pero es muy fácil de hacer con un software como el programa gratuito Statistics101. Puede introducir los resultados observados y decirle que para generar, por ejemplo, 100.000 conjuntos de datos resampled, calcular y guardar la media y la mediana de cada uno, y luego calcular el SD y la 2,5º y percentiles 97,5 de esos 100.000 y 100.000 medios medianas. Aquí hay algunos resultados de un análisis de arranque realizado en estos datos:

Datos reales: 61, 88, 89, 89, 90, 92, 93, 94, 98, 98, 101, 102, 105, 108, 109, 113, 114, 115, 120, y 138. Mean = 100.85- Media = 99,5Remuestreada Data Set #1: 61, 88, 88, 89, 89, 90, 92, 93, 98, 102, 105, 105, 105, 109, 109, 109, 109, 114, 114, y 120. Mean1 = 99,45, mediana1 = 103.50Remuestreada Data Set #2: 61, 88, 89, 89, 90, 92, 92, 98, 98, 98, 102, 105, 105, 108, 108, 113, 113, 113, 114, y 138. Mean2 = 100,7, mediana2 = 100,0(Entre Set # 2 y el siguiente conjunto, se generaron 99,996 conjuntos de datos más bootstrap.)Remuestreada Data Set #99,999: 61, 61, 88, 89, 92, 93, 93, 94, 98, 98, 98, 101, 102, 105, 109, 114, 115, 120, 120, y 138. Mean99999 = 99,45, mediana99999 = 98.00Remuestreada Data Set #100,000: 61, 61, 61, 88, 89, 89, 90, 93, 93, 94, 102, 105, 108, 109, 109, 114, 115, 115, 120, y 138. Mean100000 = 97.7, mediana100000 = 98.0

He aquí un resumen de los 100.000 remuestras:

  • La SD del 100000 significars = 3.46- este es el bootstrap SE de la media (SEM).

  • La SD del 100000 medianas = 4.24- este es el bootstrap SE de la mediana.

  • Los 2,5º y 97,5 centiles de los 100.000 medio = 94,0 y 107.6- estos son los límites de confianza del 95% para el bootstrapped significar.

  • Los 2,5º y 97,5 centiles de los 100.000 medianas = 92,5 y 108.5- estos son los límites de confianza del 95% para el bootstrapped mediana.

Así que le informe de su media y la mediana, junto con sus bootstrap errores estándar y el 95% intervalo de confianza de esta manera:

La media = 100,85 # 177- 3,46 (94,0 a 107,6) - La mediana = 99,5 # 177- 4,24 (92,5-108,5).

Se dará cuenta de que la SE es más grande (y el CI es más ancha) para la mediana que para la media. Esto es generalmente cierto para los datos distribuidos normalmente - la mediana tiene alrededor de 25% más variabilidad que la media. Pero para los datos no distribuidos normalmente, la mediana es a menudo más precisa que la media.

No es necesario utilizar bootstrapping para algo tan simple como la SE o CI de una media porque hay fórmulas simples para eso. Pero el método bootstrap simplemente puede calcular fácilmente la SE o CI durante una mediana, un coeficiente de correlación, o un parámetro farmacocinético como el AUC o vida media de eliminación de un fármaco, para el que no hay simples fórmulas SE o CI y para el cual los supuestos de normalidad no sean aplicables.

Bootstrapping es conceptualmente simple, pero no es infalible. El método implica ciertos supuestos y tiene ciertas limitaciones. Por ejemplo, es probable que no va a ser muy útil si usted tiene sólo unos pocos valores observados. Echa un vistazo Estadísticas 101 para obtener más información sobre cómo utilizar el método de arranque (y para el software Statistics101 libre de hacer los cálculos de arranque con mucha facilidad).




» » » » El método de arranque de los errores estándar y los intervalos de confianza