Cómo utilizar read.csv () para importar datos en r

Una de las maneras más fáciles y más confiables de la obtención de datos en R es el uso de archivos de texto, en particular, CSV (valores separados por comas) archivos. El formato de archivo CSV utiliza comas para separar los diferentes elementos en una línea, y cada línea de datos se encuentra en su propia línea en el archivo de texto, lo que hace que los archivos CSV ideal para representar datos tabulares.

El beneficio adicional de archivos CSV es que casi todas las aplicaciones de datos soporta la exportación de datos al formato CSV. Este es ciertamente el caso para la mayoría de aplicaciones de hoja de cálculo, como Microsoft Excel y OpenOffice Calc.

En los siguientes ejemplos, se supone que tiene un archivo CSV almacenado en una carpeta conveniente en su sistema de archivos. Para convertir una hoja de cálculo de Excel a formato CSV, debe seleccionar Archivo-Guardar como, que le da la opción de guardar el archivo en una variedad de formatos.

Tenga en cuenta que un archivo CSV puede representar sólo una sola hoja de cálculo de una hoja de cálculo. Por último, asegúrese de usar la fila superior de la hoja de cálculo (fila 1) para los encabezados de columna.

En R, se utiliza el read.csv () función para importar datos en formato CSV. Esta función tiene una serie de argumentos, pero el único argumento esencial es archivo, que especifica la ubicación y el nombre de archivo. Para leer un archivo llamado elements.csv situado en f: usar read.csv () con ruta de archivo:

> Elementos lt; - read.csv (file.path ("f:", "elements.csv"))> str (elementos) 'data.frame': 10 obs. de 9 variables: $ Atomic.number: int 1 2 3 4 5 6 7 8 9 10 $ Nombre: Factor w / 10 niveles "Berilio", "Boro", ..: 6 5 7 1 2 3 9 10 4 8 dólares Símbolo: Factor w / 10 niveles "B", "ser", "C", "F", ..: 5 6 7 2 1 3 8 10 4 9 $ Grupo: int 1 18 1 2 13 14 15 16 17 18 $ Período: int 1 1 2 2 2 2 2 2 2 2 $ Bloquear: Factor w / 2 niveles "p", "s": 2 2 2 2 1 1 1 1 1 1 $ State.at.STP: Factor w / 2 niveles "Gas", "sólido": 1 1 2 2 2 2 1 1 1 1 $ Ocurrencia: Factor w / 1 nivel "Primordial": 1 1 1 1 1 1 1 1 1 1 $ Descripción: Factor w / 6 niveles "Metal alcalino", ..: 6 5 1 2 4 6 6 6 3 5

R importa los datos en una trama de datos. Como puede ver, este ejemplo tiene diez observaciones de nueve variables.

Observe que la opción por defecto es la de convertir cadenas de caracteres en factores. Así, las columnas Nombre, Bloquear, State.At.STP, Ocurrencia, y Descripción todos se han convertido en factores. También, observe que R convierte espacios en los nombres de columna a períodos (por ejemplo, en la columna State.At.STP).

Esta opción por defecto de la conversión de cadenas a factores cuando se utiliza read.table () puede ser una fuente de gran confusión. A menudo es mejor de la importación de datos que contiene las cadenas de una manera tal que las cadenas no son factores convertidos, pero permaneces vectores de caracteres. Para importar datos que contiene cadenas, utilice el argumento stringsAsFactors = FALSO a read.csv () o read.table ():

> Elementos lt; - read.csv (file.path ("f", "elements.csv"), stringsAsFactors = FALSO)> str (elementos) 'data.frame': 10 obs. de 9 variables: $ Atomic.number: int 1 2 3 4 5 6 7 8 9 10 $ Nombre: chr "Hidrógeno" "Helio" "Lithium" "Berilio" ... $ Símbolo: chr "H" "El" " Li "" Sea "... $ Grupo: INT 1 18 1 2 13 14 15 16 17 18 $ Periodo: int 1 1 2 2 2 2 2 2 2 2 $ Bloquear: chr" s "" s "" s "" s "... $ State.at.STP: chr" Gas "" Gas "" sólido "" sólido "... $ Ocurrencia: chr" Primordial "" Primordial "" Primordial "" Primordial "... $ Descripción: chr "no metálica" "gas noble" "Metal alcalino" "metal de tierra alcalina" ...

Si usted tiene un archivo en el formato de la UE (Unión Europea) (donde se utilizan comas como separadores decimales y comas se utilizan como separadores de campo), es necesario importarlo a R utilizando la read.csv2 () función.




» » » » Cómo utilizar read.csv () para importar datos en r