Estadísticas enigmas: se trata de pacientes que no responden la encuesta
No respondedores son siempre un problema cuando se está calculando los resultados de una encuesta. Antes de poder los números de crisis en todas las encuestas que te dan la espalda, usted tiene que decidir qué hacer con las encuestas que no lo hizo volver.
Un artículo periodístico sobre la última encuesta dice que el 50 por ciento de los encuestados dijo que bla, bla, bla. La letra pequeña dice que los resultados se basan en una encuesta realizada a 1.000 adultos en los Estados Unidos. Pero espera - es 1.000 el número real de personas seleccionadas para la muestra, o es el número final de los encuestados? Es posible que tenga que tomar un segundo Look-esos dos números casi nunca coinciden.
Por ejemplo, Jenny quiere saber cuál es el porcentaje de personas en los Estados Unidos nunca han engañado a sabiendas en sus impuestos. En su clase de estadísticas, se enteró de que si ella consigue una muestra de 1.000 personas, el margen de error para ella encuesta sólo es más o menos el 3 por ciento, lo que ella piensa que es maravilloso. Así que ella se propone lograr la meta de 1.000 respuestas a la encuesta. Ella sabe que, en estos días, es difícil conseguir que la gente responda a una encuesta, y ella está preocupada de que ella puede perder una gran cantidad de su muestra de esa manera, por lo que tiene una idea. ¿Por qué no enviar más encuestas de lo que necesita para que ella obtiene 1,000 encuestas de vuelta?
Jenny mira a varios resultados de la encuesta en los periódicos, revistas y en Internet, y se encuentra con que la tasa de respuesta (el porcentaje de personas que realmente respondan a una encuesta) es típicamente alrededor de 25 por ciento. (En términos del mundo real, esto es generoso, lo creas o no, pero pensar en ello:.? ¿Cuántas encuestas has tirado últimamente) Así figura Jenny que si se envía 4.000 encuestas y obtiene el 25 por ciento de ellos de vuelta, ella tiene las 1.000 encuestas que necesita para hacer su análisis, responder a su pregunta, y tienen ese pequeño margen de error de más o menos 3 por ciento.
Jenny lleva a cabo la encuesta, y al igual que un reloj, de las 4.000 encuestas que envía hacia fuera, 1000 regresó. Ella va adelante con su análisis y encuentra que 400 de esas personas reportaron hacer trampa en sus impuestos (40 por ciento). Ella agrega su margen de error y los informes, "Basado en mi datos de la encuesta, el 40 por ciento de los estadounidenses trampa en sus impuestos, más o menos 3 puntos porcentuales."
Ahora sostenga el teléfono, Jenny. Ella sólo sabe lo que esas 1.000 personas que regresaron la encuesta dijeron. Ella no tiene idea de lo que dijeron los otros 3.000 personas. Y aquí viene lo bueno: Independientemente de si alguien responde a una encuesta suele estar relacionada con el motivo de la encuesta que se está haciendo. No es una cosa al azar. Aquellos que no respondieron (personas que no responden a una encuesta) llevan mucho peso en términos de lo que no está tomando tiempo para decirte.
Por el bien del argumento, supongamos que 2.000 de las personas que originalmente recibieron la encuesta estaban incómodos con la pregunta porque engañan a sus impuestos, y que no quería que nadie lo supiera al respecto, por lo que arrojó la encuesta en la basura . Supongamos que las otras 1.000 personas no hacen trampas en sus impuestos, por lo que no pensaron que era un problema y no regresó la encuesta. Si estos dos escenarios eran ciertos, los resultados se ven así:
Cheaters = 400 (encuestados) + 2.000 (que no respondieron) = 2400
Estos resultados plantean el porcentaje total de los tramposos a 2.400 dividido por 4.000 - 60 por ciento. Esa es una gran diferencia!
Usted podría ir completamente a la inversa con los 3.000 que no respondieron. Puede suponer que ninguno de ellos engañan, pero simplemente no se toman el tiempo para decirlo. Si usted supiera esta información, se llega a 600 (encuestados) + 3.000 (que no respondieron) = 3.600 noncheaters. Fuera de 4,000 encuestados, esto es el 90 por ciento. La verdad es probable que sea en algún lugar entre los dos ejemplos anteriores, pero que no respondieron que sea muy difícil de decir.
Y lo peor es que las fórmulas Jenny utiliza para el margen de error no saben que la información se puso en ellos se basa en datos parciales, por lo que su margen reportado 3 por ciento de error es incorrecto. Las fórmulas felices para poner hacia fuera los resultados no importa qué. Todo depende de usted para asegurarse de que lo que usted pone en las fórmulas es bueno, información limpio.
Conseguir 1.000 resultados cuando usted envía 4.000 encuestas es para nada tan bueno como conseguir 1.000 resultados al enviar 1.000 encuestas (o incluso 100 resultados de 100 encuestas). Planifique su encuesta sobre la base de la cantidad de seguimiento que puedes hacer con la gente para hacer el trabajo, y si se necesita una muestra de menor tamaño, que así sea. Al menos, los resultados tienen una mejor oportunidad de ser estadísticamente correcto.