Cómo agregar campos calculados a los datos en r

Después de crear el subconjunto apropiado de sus datos, el siguiente paso en el análisis es probable que sea para realizar algunos cálculos con R.

Cómo hacer aritmética en columnas de una trama de datos

R hace que sea muy fácil de realizar cálculos en columnas de una trama de datos, ya que cada columna es un vector propio. Cumplir con el iris trama de datos, tratar de hacer un par de cálculos en las columnas. Por ejemplo, calcular la relación entre las longitudes y la anchura de los sépalos:

> X lt; - iris $ Sepal.Length / iris $ Sepal.Width

Ahora usted puede utilizar todas las herramientas de investigación para examinar su resultado. Por ejemplo, inspeccionar los primeros cinco elementos de sus resultados con el cabeza () función:

> Cabeza (x) [1] 1.633333 1.468750 1.483871 1.457143 1.388889 1.384615

Como puede ver, la realización de cálculos en columnas de una trama de datos es sencillo. Hemos de tener en cuenta que cada columna es realmente un vector, por lo que simplemente tiene que recordar cómo realizar operaciones sobre vectores.

Cómo utilizar con y dentro de mejorar la legibilidad del código

Después de un corto tiempo de escribir declaraciones subconjunto de R, obtendrá cansado de escribir el signo de dólar para extraer columnas de una trama de datos. Afortunadamente, hay una manera de reducir la cantidad de escribir y hacer que su código mucho más fácil de leer al mismo tiempo. El truco consiste en utilizar el con() función. Prueba esto:

> Y lt; - con (iris, Sepal.Length / Sepal.Width)

los con() función permite hacer referencia a columnas dentro de una trama de datos sin utilizar explícitamente el signo de dólar, o incluso el nombre de la trama de datos en sí. Así, en nuestro ejemplo, porque se utiliza con (iris, ...) R sabe para evaluar tanto Sepal.Length y Sepal.Width en el contexto de iris.

Con suerte, usted está de acuerdo que esto es mucho más fácil de leer y entender. Al imprimir los valores de su nueva variable y, se puede confirmar que es idéntica a X en el ejemplo anterior.

> Cabeza (y) [1] 1.633333 1.468750 1.483871 1.457143 1.388889 1.384615

También puede utilizar el idéntica () función para obtener R a dirá si estos valores son, de hecho, el mismo:

> Idénticos (x, y) [1] TRUE

Además de con(), el útil dentro de () función le permite asignar valores a columnas de datos muy fácilmente. Digamos que usted quiere añadir su relación calculada de longitud sépalo a la anchura de la estructura de datos original. Usted ya está familiarizado con la escritura de esta manera:

> Relación iris $ lt; - iris $ Sepal.Length / iris $ Sepal.Width

Ahora, usando dentro de () se convierte en la siguiente:

> Iris lt; - dentro de los (iris, la relación de lt; - Sepal.Length / Sepal.Width)

Esto funciona de una manera muy similar a con(), excepto que usted puede utilizar el operador de asignación (lt; -) Dentro de su función. Si ahora fijamos en la estructura de iris, te darás cuenta de que proporción es una columna:

> Cabeza (iris $ ratio) [1] 1.633333 1.468750 1.483871 1.457143 1.388889 1.384615



» » » » Cómo agregar campos calculados a los datos en r