Cómo preparar datos en r

Con R a su alcance, usted puede formar rápidamente sus datos exactamente como usted lo desee. Eso es bueno porque en muchos casos de la vida real, se obtiene un montón de datos en un archivo grande, y preferiblemente en un formato que no se puede utilizar en absoluto. Esa debe ser la regla de oro de la recolección de datos: Asegúrese de que su estadística suda sus pantalones con sólo mirar los datos.

Seleccionar sólo las variables que necesita y transformarlos al formato adecuado se vuelve bastante fácil con trucos en R.

Vamos a preparar el marco de datos mtcars un poco el uso de algunos trucos simples. En primer lugar, crear un marco de datos carros Me gusta esto:

> Autos lt; - mtcars [c (1,2,9,10)]> coches $ engranajes lt; - ordenado (coches $ engranajes)> coches $ am lt; - factores (coches $ am, etiquetas = c ('auto', 'manual'))

Con este código, haga lo siguiente:

  • Seleccione cuatro variables de la trama de datos mtcars y guardarlos en una trama de datos llamada carros. Tenga en cuenta que se utiliza el sistema de índice de listas para seleccionar las variables.

  • Hacer la variable engranaje en estos datos enmarcar un factor ordenada.

  • Dar la variable soy el valor 'auto' si su valor original es 1, y 'manual' si su valor original es 0.

  • Transformar la nueva variable soy a un factor.

En la conversión de coches $ am, observa que el primer argumento de la ifelse () afirmación no es una expresión lógica. La variable original tiene 0 y 1 como valores, y R lee una 0 como FALSO y todo lo demás CIERTO. Puede utilizar esta propiedad en su propio código, como se muestra anteriormente.

Después de ejecutar este código, usted debe tener un conjunto de datos carros en su espacio de trabajo con la siguiente estructura:

> Str (coches) 'data.frame': 32 obs. de 4 variables: $ mpg: num 21 21 22.8 21.4 18.7 ... $ cyl: num 6 6 4 6 8 ... $ am: Factor w / 2 niveles "auto", "Manual": 1 1 1 2 2. .. $ engranajes: Ord.factor w / 3 niveles "3" lt; "4" lt; "5": 2 2 2 1 1 ...



» » » » Cómo preparar datos en r