Cómo mirar a los márgenes de datos y proporciones en r

En el análisis de datos categóricos, muchas técnicas de investigación utilizan el totales marginales

de la tabla en los cálculos. Los totales marginales son los recuentos totales de los casos más de las categorías de interés. Por ejemplo, los totales marginales para el comportamiento sería la suma sobre las filas de la tabla trial.table.

¿Cómo añadir márgenes a la mesa

R le permite extender una tabla con los totales marginales de las filas y columnas en un simple comando. Para ello, se utiliza el addmargins () función, así:

> Addmargins (trial.table) Sumrisk sana enferma 349 43no_risk 11 32 41 86 43Sum45

También puede agregar los márgenes de una sola dimensión especificando el margen argumento a favor de la addmargins () función. Por ejemplo, para obtener sólo las cuentas marginales para el comportamiento, haga lo siguiente:

> Addmargins (trial.table, el margen = 2) enfermo sana Sumrisk 349 43no_risk 11 32 43

los margen argumento toma un número o un vector de números, pero puede ser un poco confuso. Los márgenes se numeran de la misma manera como en el aplicar () función. Así 1 es sinónimo de filas y 2 para las columnas. Para agregar el margen de la columna, es necesario establecer margen a 2, pero este margen columna contiene los totales de fila.

Cómo calcular proporciones

Puede convertir una tabla con los recuentos a una mesa con proporciones muy fácilmente usando el prop.table () función. Esto también funciona para las tablas multivía. Si quieres conocer las proporciones de observaciones en cada célula de la tabla con el número total de casos, sólo tiene que hacer lo siguiente:

> Prop.table (trial.table) healthyrisk enferma 0,3953488 0,1279070 0,3720930 0.1046512no_risk

Esto le indica que, por ejemplo, el 10,4 por ciento de las personas en el estudio eran saludables, incluso cuando mostraron comportamientos de riesgo.

Cómo calcular las proporciones más columnas y filas

Pero lo que si quieres saber qué fracción de las personas con comportamientos de riesgo se enfermó? Entonces usted no tiene que calcular las proporciones dividiendo los recuentos por el número total de casos para toda la dataset- su lugar, dividir los recuentos de los totales marginales.

R le permite hacer esto muy fácilmente utilizando, de nuevo, el prop.table () función, pero esta vez especificando el margen argumento.

Echa un vistazo a la tabla de nuevo. ¿Quieres calcular las proporciones más de cada fila, ya que cada fila representa una categoría de comportamiento. Así, para obtener las proporciones correctas, se especifica margen = 1 Me gusta esto:

> Prop.table (trial.table, el margen = 1) healthyrisk enferma 0,7906977 0,2558140 0,7441860 0.2093023no_risk

En cada fila, las proporciones suman 1. Ahora se puede ver que el 79 por ciento de las personas que muestran el comportamiento de riesgo se enfermó. Bueno, no es una gran noticia que los comportamientos de riesgo puede causar enfermedades, y las proporciones que se muestran en el último punto de resultado en esa dirección.

Sin embargo, los científicos creen que sólo si se puede realizar copias de seguridad de una manera más objetiva. Ese es el punto en el que usted debe considerar hacer algunas pruebas estadísticas.




» » » » Cómo mirar a los márgenes de datos y proporciones en r