Cómo romper las estadísticas categóricas utilizando tablas de doble

Usted puede romper los datos categóricos abajo usando tablas de doble entrada (también conocidas como tablas de contingencia, tabulaciones cruzadas o tablas de referencias cruzadas) para resumir la información estadística sobre los diferentes grupos. Los datos categóricos (también conocido como datos cualitativos) Capturar cualidades o características de un individuo, como el color de ojos de una persona, sexo, partido político, o una opinión sobre algún tema (normalmente utilizando categorías como acuerdo, en desacuerdo o No opinión, o alguna variación de estos).

Los datos categóricos tienden a caer en grupos o categorías bastante natural. " partido político, " por ejemplo, por lo general tiene cuatro grupos en los Estados Unidos: el demócrata, republicano, independiente, y otros. Los datos categóricos a menudo provienen de datos de la encuesta, pero también se pueden recoger en los experimentos. Por ejemplo, en una prueba experimental de un nuevo tratamiento médico, los investigadores pueden utilizar tres categorías para evaluar el resultado del experimento: ¿El paciente mejora, peor, o se queda la misma mientras se somete al tratamiento?

Los datos categóricos se resumen a menudo al informar el porcentaje de individuos que caen en cada categoría. Por ejemplo, los encuestadores pueden reportar las estadísticas de afiliación políticos dando el porcentaje de republicanos, demócratas, independientes, y otros. Para calcular el porcentaje de individuos de una determinada categoría, encontrar el número de personas en esa categoría, se divide por el número total de personas en el estudio, y luego se multiplica por 100%. Por ejemplo, si un estudio de 2.000 adolescentes incluyó 1.200 hembras y machos 800, los porcentajes resultantes serían (1200 # 247- 2000) # 8727- 100% = 60% de mujeres y (800 # 247- 2000) # 8727- 100% = 40% hombres.

Puede romper los datos categóricos aún más mediante la creación de algo que se llama tablas de doble entrada. Tablas de doble son tablas con filas y columnas. Ellos resumen la información de dos variables categóricas a la vez, como el género y los partidos políticos, por lo que pueden ver (o fácilmente calcular) el porcentaje de individuos en cada combinación de categorías y utilizarlos para hacer comparaciones entre los grupos.

El gobierno de Estados Unidos calcula y resume un montón de datos categóricos utilizando tablas de referencias cruzadas. Datos de edad y de género típicos, publicados por la Oficina del Censo de los Estados Unidos para una encuesta realizada en 2009, se muestran en esta tabla. (Normalmente la edad sería considerado una variable numérica, pero la forma en que el gobierno de Estados Unidos informa que, la edad se divide en categorías, por lo que es una variable categórica.)

Estados Unidos Población, desglosados ​​por edad y sexo (2009)
Grupo de edadLos machos%Las hembras%Cantidad%
Bajo 5108870087.19104126486.69212996566.94
5-9105359006.96100737346.48206096346.71
10.14102225226.759,751,0426.27199735646.51
15-19110512897.30104865486.74215378377.02
20-24110935527.32104460076.72215395597.02
25-29111155607.34105621596.79216777197.06
30-34101079746.679,780,6296.29198886036.48
35-39103530166.84101853356.55205383516.69
40-44105041396.94104874666.74209916056.84
45-49112955247.46115355687.42228310927.44
50-54106778477.05110835447.13217613917.09
55-599,204,6666.089,770,3606.28189750266.18
60-647,576,9335.008,234,9905.29158119235.15
65-695,511,1643.646,273,1564.03117843203.84
70-744,082,2262.704,925,5213.179,007,7472.93
75-793,149,2362.084,176,2922.687,325,5282.39
80-842,298,2601.523,524,0742.275,822,3341.90
85-891,266,8990.842,395,4981.543,662,3971.19
90-94424.8820.281,077,3810.691,502,2630.49
95-99821350.05319.8420.21401.9770.13
100+87580.01552660.04640240.02
Cantidad151 449 490100.00155557060100.00307006550100.00

Puede examinar muchas facetas diferentes de la población de Estados Unidos observando y trabajando con diferentes números de la tabla. Por ejemplo, mirando a género, se observa que las mujeres superan ligeramente los hombres - la población en 2009 fue de 50,67% mujeres (dividir el número total de hembras por el tamaño total de la población y se multiplica por 100%) y 49,33% hombres (dividir el número total de varones por tamaño de la población total, y se multiplica por 100%). También puede buscar a la edad: el porcentaje de la población que es menor de 5 años de edad fue de 6.94% (dividir el número total menores de 5 años por el tamaño total de la población y se multiplica por 100%). El grupo más numeroso corresponde a los 45-49 años de edad, que constituían 7,44% de la población.

A continuación, se puede explorar una posible relación entre el género y la edad mediante la comparación de varias partes de la tabla. Usted puede comparar, por ejemplo, el porcentaje de mujeres que hombres en el grupo de edad de 80 años y más. Debido a que estos datos se presentan en incrementos de 5 años, que tiene que hacer un poco de matemáticas con el fin de obtener su respuesta, sin embargo. El porcentaje de la población que es femenina y 80 años y más (mirando a la columna 7 de la tabla) es 2,27% + 1,54% + 0,69% + 0,21% + 0,04% = 4,75%. El porcentaje de varones de 80 años y más (mirando a la columna 5 de la tabla) es 1,52% + 0,84% + 0,28% + 0,05% + 0,01% = 2,70%. Esto muestra que el grupo de edad de 80 años y más para las mujeres es de alrededor del 76% más grandes que los machos (porque [4,75-2,70] # 247- 2,70 = 0,76).




» » » » Cómo romper las estadísticas categóricas utilizando tablas de doble