Cómo calcular las proporciones de datos y encontrar el centro de r

Después de tener la tabla de datos con las cuentas, puede utilizar R para calcular fácilmente la proporción de cada cargo al total simplemente dividiendo la mesa por las cuentas totales. Para calcular la proporción de cajas de cambio manuales y automáticas en el conjunto de datos carros, puede utilizar el siguiente código:

> Amtable / sum (amtable) auto manual0.40625 0.59375

Sin embargo, R también proporciona el prop.table () función para hacer lo mismo. Usted puede obtener el mismo resultado que la línea de código anterior haciendo lo siguiente:

> Prop.table (amtable)

Se preguntarán por qué usted utilizaría una función extra por algo que es tan fácil como dividiendo por la suma. los prop.table () función también puede calcular proporciones marginales.

En estadística, la modo de una variable categórica es el valor que ocurre con mayor frecuencia. No es exactamente el centro de datos, pero si no hay orden en sus datos - si nos fijamos en una variable nominal - realmente no se puede hablar de un centro tampoco.

Aunque no hay una función específica para calcular el modo, lo puede conseguir mediante la combinación de un par de trucos:

  1. Para obtener los recuentos de cada valor, el uso mesa().

  2. Para encontrar la ubicación del número máximo de recuentos, utilice max ().

  3. Para encontrar el modo de la variable, seleccione el nombre que corresponde con la ubicación en el paso 2 de la tabla en el paso 1.

Por lo tanto, para encontrar el modo para la variable soy en el conjunto de datos carros, puede utilizar el siguiente código:

> Identificación lt; - amtable == max (amtable)> nombres (amtable) [id] [1] "manual"

La variable Identificación contiene un vector lógico que tiene el valor CIERTO para cada valor de la tabla soytpoder que es igual al máximo en esa tabla. Usted selecciona el nombre de los valores en soytpoder el uso de este vector lógico como un índice.

También puede utilizar el which.max () función para encontrar la ubicación de la máxima en un vector. Esta función tiene una desventaja importante, sin embargo: Si tiene varios máximos, which.max () devolverá la posición de sólo el primer máximo. Si usted está interesado en todos los máximos, debe utilizar el constructo en el ejemplo anterior.




» » » » Cómo calcular las proporciones de datos y encontrar el centro de r