Cómo corregir errores de lectura de datos en r
Es probable que los errores más comunes en R se realizan durante la lectura de datos en archivos de texto utilizando read.table () o read.csv (). Muchos errores resultan en errores R de lanzamiento, pero a veces sólo se notan algo salió mal cuando nos fijamos en la estructura de los datos. En este último caso a menudo se encuentra que algunas o todas las variables se convierten en factores cuando en realidad no deberían ser.
Cuando R da errores o la estructura de los datos no es lo que usted piensa que debería ser, compruebe lo siguiente:
¿Ha olvidado especificar el argumento header = TRUE? Si es así, R verá los nombres de columna como valores y, como resultado, convertir todas las variables a un factor como siempre lo hace con los datos de caracteres en un archivo de texto.
¿Tuvo espacios en sus nombres de columna o datos? los read.table () función puede interpretar espacios en, por ejemplo, los nombres de columna o de datos de cadena como un separador. A continuación, obtiene errores que le dice 'línea x no tenía elementos Y'.
¿Tuviste un separador decimal diferente? En algunos países, los decimales están separados por una coma. Tienes que decirle específicamente R que es el caso con el argumento diciembre = "" en el read.table () función.
¿Ha olvidado especificar stringsAsFactors = FALSO? De forma predeterminada, R cambia los datos de caracteres a factores, por lo que siempre hay que añadir este argumento si desea que sus datos permanezcan las variables de carácter.
¿Sabía usted tiene otra forma de especificar los valores que faltan? R lee 'N / A' en un archivo de texto como un valor perdido, pero el archivo puede utilizar un código diferente (por ejemplo, 'desaparecidos'). R verá que como texto y otra vez convertir esa variable a un factor. A resolver esto especificando el argumento na.strings en el read.table () función.
Si siempre comprueba la estructura de los datos inmediatamente después de leerlo, puede detectar errores mucho antes y evitar las horas de frustración. Su mejor apuesta es utilizar str () para obtener información sobre los tipos y cabeza () para ver si los valores son lo que esperabas.
Sobre el autor
Cómo determinar una estructura de datos en r La primera decisión que tiene que hacer antes de analizar los datos es cómo representar que los datos dentro R. Si los datos tiene sólo una dimensión, entonces usted ya sabe que los vectores representan este tipo de datos muy bien. Sin embargo,…
Cómo obtener sus datos de r Por la misma razón por la que es conveniente para importar datos en R utilizando CSV (valores separados por comas) archivos, también es conveniente para exportar los resultados de R para otras aplicaciones en formato CSV. Para crear un archivo…
Cómo manipular archivos en r De vez en cuando, es posible que desee escribir un guión en I que atravesar una carpeta determinada y realizar acciones en todos los datos en los archivos o un subconjunto de archivos en esa carpeta.Para obtener una lista de los archivos en una…
Cómo preparar datos en r Con R a su alcance, usted puede formar rápidamente sus datos exactamente como usted lo desee. Eso es bueno porque en muchos casos de la vida real, se obtiene un montón de datos en un archivo grande, y preferiblemente en un formato que no se puede…
Cómo resumir un conjunto de datos en r Si necesita una descripción rápida de su conjunto de datos, se puede, por supuesto, siempre use el comando R str () y mirar la estructura. Pero esto te dice algo sólo acerca de las clases de sus variables y el número de observaciones. Además,…
Cómo utilizar read.csv () para importar datos en r Una de las maneras más fáciles y más confiables de la obtención de datos en R es el uso de archivos de texto, en particular, CSV (valores separados por comas) archivos. El formato de archivo CSV utiliza comas para separar los diferentes…
Cómo utilizar read.table () para importar datos tabulares en r Las funciones read.csv (), read.csv2 (), y read.delim () son casos especiales de la polivalente read.table () función en R que puede hacer frente a una amplia variedad de formatos de archivo de datos. los read.table () función tiene una serie de…
Cómo utilizar el portapapeles para copiar y pegar datos en r Otra forma de importar datos de forma interactiva en R es utilizar el portapapeles para copiar y pegar datos. Para importar datos desde el Portapapeles, utilice el readClipboard () función. Por ejemplo, seleccione las celdas B2: B4 en la hoja de…
¿Cómo trabajar con los archivos de datos no-csv en r A pesar de que CSV (valores separados por comas) archivos son ampliamente utilizados para la importación y exportación de datos en R, que no siempre son el formato más apropiado. Algunos formatos de datos permiten la especificación de datos que…
Importación de datos en r R tiene muchas funciones que le permiten importar datos de otras aplicaciones. La siguiente tabla muestra algunas de las funciones de importación de texto útiles, lo que hacen, y ejemplos de cómo usarlos.FunciónQue haceEjemploread.table ()Lee…
R para dummies Incluso con buenos libros de introducción a R, que tendrá que utilizar los archivos R Ayuda. Los archivos de ayuda de I proporcionan información detallada sobre el uso de diferentes funciones y sus peculiaridades. R tiene una excelente ayuda…
Cómo leer datos simples desde un archivo de texto en SPSS Aquí hay un procedimiento que puede seguir para leer datos de un archivo de texto simple en SPSS. El archivo se llama awards.txt. Contiene dos casos (filas de datos) como dos líneas de texto, con los elementos de datos en las dos líneas separadas…