¿Cómo crear una trama de datos desde cero en r

La conversión de una matriz para una trama de datos en R no puede ser usado para construir una trama de datos con diferentes tipos de valores. Si se combinan ambos datos numéricos y de caracteres en una matriz, por ejemplo, todo se convierte en personaje.

Usted puede construir una trama de datos a partir de cero, sin embargo, el uso de la data.frame () función.

Hacer una trama de datos de vectores en R

Así que, vamos a hacer un poco de trama de datos con los nombres, los salarios y las fechas a partir de un par de compañeros de trabajo imaginarios. En primer lugar, se crean tres vectores que contienen la información necesaria así:

> Empleado lt; - c ('John Doe', 'Peter Gynn', 'Jolie Hope')> salarial lt; - c (21000, 23400, 26800)> startdate lt; - as.Date (c ('11/01/2010 "," 25/03/2008 "," 03/14/2007 "))

Ahora usted tiene tres vectores diferentes en su área de trabajo:

  • LA carácter vectorial llamado empleado, que contiene los nombres

  • LA vector numérico llamado salario, que contiene los salarios anuales

  • LA fecha vectorial llamado fecha de inicio, que contiene las fechas en que se iniciaron los contratos

A continuación, se combinan los tres vectores en una trama de datos usando el siguiente código:

> Employ.data lt; - data.frame (empleado, salario, startdate)

El resultado de esto es una trama de datos, employ.data, con la siguiente estructura:

> Str (employ.data) 'data.frame': 3 obs. de 3 variables: $ empleado: Factor w / 3 niveles de "John Doe", "Jolie Esperanza", ..: 1 3 2 $ de salario: num 21000 23400 26800 $ startdate: Fecha, formato: "01.11.2010" " 2008-03-25 "...

Para combinar una serie de vectores en una trama de datos, usted sencillo añadir todos los vectores como argumentos a la data.frame () función, separados por comas. R creará una trama de datos con las variables que se denominan el mismo que los vectores utilizados.

Mantenga personajes como personajes en R

Usted puede haber notado algo extraño al mirar la estructura de employ.data. Considerando que el vector empleado es un vector de caracteres, R hizo la variable empleado en los datos de enmarcar un factor.

R hace esto por defecto, pero usted tiene un argumento adicional a la data.frame () función que puede evitar esto - es decir, el argumento stringsAsFactors. en el employ.data ejemplo, usted puede prevenir la transformación de un factor de la empleado variable utilizando el siguiente código:

> Employ.data lt; - data.frame (empleado, salario, startdate, stringsAsFactors = FALSO)

Si nos fijamos en la estructura de la trama de datos ahora, se ve que la variable empleado es un vector de caracteres, como se muestra en la siguiente salida:

> Str (employ.data) 'data.frame': 3 obs. de 3 variables: $ empleados: chr "John Doe" "Peter Gynn" "Jolie Esperanza" $ Salario: num 21000 23400 26800 $ StartDate: Fecha, formato: "11/01/2010" "03/25/2008" .. .

De forma predeterminada, R siempre transforma vectores de caracteres a factores al crear una trama de datos con los vectores de caracteres o convertir una matriz de caracteres de una trama de datos. Esto puede ser una causa desagradable de errores en su código si no eres consciente de ello. Si usted hace un hábito de especificar siempre stringsAsFactors argumento, puede evitar una gran frustración.




» » » » ¿Cómo crear una trama de datos desde cero en r