Cómo analizar los datos en tablas con r

Usted puede utilizar R prop.test ()

función para los datos en matrices y tablas. por prop.test (), estas tablas necesita tener dos columnas con el número de recuentos para los dos resultados posibles.

Cómo probar la contingencia de las tablas

Como alternativa, puede utilizar el chisq.test () función para analizar tablas con una chi-cuadrado (# 967-2) Prueba de contingencia. Para hacer esto en la matriz con los datos de los cinturones de seguridad, sólo tiene que hacer lo siguiente:

> Chisq.test (seatbelt.table)

Esto devuelve el siguiente resultado:

 Chi-cuadrado de Pearson con Yates continuidad correctiondata: survivorsX cuadrado = 24.3328, df = 1, p-valor = 8.105e-07

Los valores de la estadística (X-squared), Los grados de libertad y el valor de p son exactamente lo mismo que con la prop.test () función. Eso es de esperarse, ya que - en este caso, al menos - ambas pruebas son equivalentes.

Cómo probar tablas con más de dos columnas

ni idea prop.test () función, el chisq.test () función puede hacer frente a las mesas con más de dos columnas e incluso con más de dos dimensiones. Para ilustrar esto, vamos a echar un vistazo a la tabla HairEyeColor. Usted puede ver su estructura con el siguiente código:

> Str (HairEyeColor) Tabla [1: 4, 1: 4, 1: 2] 53 10 3 32 11 50 10 30 10 25 ...- attr (*, "dimnames") = Lista de 3 .. $ pelo: chr [1: 4] "Negro" "Brown" "Red" "rubio" .. $ ojos: chr [1: 4] "Brown" "Blue" "Hazel" "Verde" .. $ Sexo: chr [1: 2] "Hombre" "Mujer"

Así, la mesa HairEyeColor tiene tres dimensiones: una para el color del pelo, uno por color de los ojos, y uno para el sexo. La tabla representa la distribución de estas tres características entre 592 estudiantes.

Los nombres de las dimensiones de una tabla se almacenan en un atributo llamado dimnames. Como se puede ver en la salida del str () función, esto es en realidad una lista con los nombres de las filas / columnas en cada dimensión. Si esta lista es una lista con nombre, los nombres se utilizan para etiquetar las dimensiones. Puede utilizar el dimnames () función para extraer o cambiar los nombres de dimensión.

Para comprobar si el color del pelo y el color de los ojos están relacionados, puede contraer la mesa durante las dos primeras dimensiones utilizando el margin.table () funcionar para resumir el color del pelo y de los ojos para ambos géneros. Esta función suma los valores en algunas dimensiones para darle un cuadro resumen con menos dimensiones. Para eso, hay que especificar qué márgenes que desea conservar.

Así que, para obtener la tabla de cabello y color de los ojos, se utiliza el siguiente:

> HairEyeMargin lt; - margin.table (HairEyeColor, el margen = c (1,2))> HairEyeMarginEyeHair Marrón Azul Hazel Greenblack 68 20 15 119 84 54 5Brown 29Red 26 17 14 7 94 10 14Blond 16

Ahora sólo tiene que comprobar si el cabello y color de los ojos están relacionadas por probarlo en esta tabla:

> Chisq.test testdata (HairEyeMargin) de Pearson Chi-cuadrado: HairEyeMarginX cuadrado = 138,2898; gl = 9, p-valor lt; 2.2e-16

Como era de esperar, la salida de esta prueba te dice que algunas combinaciones de cabello y color de los ojos son más comunes que otros. No es una gran sorpresa, pero puede utilizar estas técnicas en otras, preguntas de investigación más interesantes.




» » » » Cómo analizar los datos en tablas con r