Cómo manejar la multiplicidad en datos de ensayos clínicos
Cada vez que se realiza una prueba de significación estadística, se corre un riesgo de ser engañado por las fluctuaciones aleatorias en el pensamiento de que algún efecto real está presente en sus datos cuando, de hecho, no existe ninguno.
Este escenario se denomina Error de tipo I. Cuando usted dice que usted requiere p lt; 0,05 para la significación, que está probando en el 0,05 (o 5 por ciento) nivel alfa o decir que quiere limitar su tasa de error de tipo I a 5 por ciento. Pero esa tasa de error del 5 por ciento se aplica a todos y cada prueba estadística se ejecuta.
Cuanto más los análisis que realiza sobre un conjunto de datos, más sus generales aumenta el nivel de alfa: Realice dos pruebas y su probabilidad de al menos uno de ellos saliendo falsamente significativo es cerca de 10 por ciento- se ejecutan 40 pruebas, y el nivel alfa global salta a 87 por ciento. Esto se conoce como el problema de Multiplicyoty, o como Tipo inflación error de E.
Algunos métodos estadísticos que implican comparaciones múltiples (como pruebas post-hoc siguientes un ANOVA para comparar varios grupos) incorporan un ajuste incorporado para mantener la alfa global de tan sólo un 5 por ciento en todas las comparaciones. Pero cuando estás probando diferentes hipótesis, como comparar diferentes variables en diferentes momentos entre los diferentes grupos, le toca a usted decidir qué tipo de estrategia de control alfa (si lo hay) que desea implementar.
Tienes varias opciones, entre ellas las siguientes:
No controlar la multiplicidad y aceptar la posibilidad de que algunos de sus resultados "significativos" habrá falsamente significativo. Esta estrategia se utiliza a menudo con las hipótesis relacionadas con la secundaria y exploratorio objetivos- el protocolo general afirma que no hay conclusiones definitivas se harán a partir de estas pruebas exploratorias. Todos los resultados "significativos" se considera sólo "señales" de los posibles efectos reales y tendrán que ser confirmados en estudios posteriores antes de sacar conclusiones definitivas.
Controlar el nivel alfa a través de sólo las hipótesis más importantes. Si tiene dos objetivos coprimarios, puede controlar alfa a través de las pruebas de esos dos objetivos.
Puede controlar alfa al 5 por ciento (o para cualquier nivel que desee) a través de un conjunto de n pruebas de hipótesis en varias formas- siguientes son algunos de los más populares:
El ajuste de Bonferroni: Pon a prueba cada hipótesis en el 0,05 /n nivel alfa. Así que para controlar alfa global de 0,05 a través de dos variables principales, necesita p lt; 0.025 para la significación al probar cada uno de ellos.
Una estrategia de prueba jerárquica: Clasifique sus puntos finales en orden decreciente de importancia. Pon a prueba el más importante primero, y si se da p lt; 0.05, concluyen que el efecto es real. A continuación, prueba la siguiente más importante, de nuevo utilizando p lt; 0,05 para la significación.
Continúe hasta que se obtiene un resultado no significativo (p> 0,05) - y luego se detiene la prueba (o considerar todas las pruebas ulteriores ser sólo exploratoria y no sacar conclusiones formales sobre ellos).
El control de la tasa de falso descubrimiento (FDR): Este enfoque se ha hecho popular en los últimos años para hacer frente a la multiplicidad de gran escala, que surge en áreas como las pruebas de genómica y análisis de imagen digital que puede implicar muchos miles de pruebas (como el uno por gen o uno por píxel) en lugar de sólo unos pocos .
En lugar de tratar de evitar incluso un soltero conclusión falsa de importancia (como el de Bonferroni y otros métodos de control de la alfa clásico hacen), usted simplemente quiere controlar el proporción de pruebas que salen falsos positivos, lo que limita la tasa descubrimiento de que falsa a alguna fracción razonable de todas las pruebas. Estos resultados positivos pueden ser examinados en un estudio de seguimiento.