Cómo sustituir texto en r
los sub () función (abreviatura de sustituto) En I busca un patrón en el texto y reemplaza este patrón con el texto de reemplazo. Tu usas sub () para sustituir el texto para el texto, y utilizar su primo gsub () para sustituir todas las ocurrencias de un patrón. (Los g en gsub () representa global.)
Supongamos que usted tiene la sentencia Él es un lobo con piel barato, que es claramente un error. Usted puede arreglar con un gsub () sustitución. los gsub () función toma tres argumentos: el patrón de encontrar, el patrón de reemplazo, y el texto para modificar:
> Gsub ("barato", "Un lobo en la ropa barata" "de las ovejas") [1] "Un lobo con piel de cordero"
Otro tipo común de problema que puede ser resuelto con la sustitución de texto es la eliminación de subcadenas. Extracción subseries es la misma que la sustitución de la subcadena con texto vacío (es decir, nada de nada).
Imagine una situación en la que usted tiene tres nombres de archivo en un vector: file_a.csv, file_b.csv, y file_c.csv. Su tarea consiste en extraer el la, b, y c de esos nombres de archivo. Usted puede hacer esto en dos pasos: En primer lugar, sustituir el patrón "archivo_" sin nada y, a continuación, reemplace el ".csv" sin nada. Usted le dejó con su vector deseado:
> X lt; - c ("file_a.csv", "file_b.csv", "file_c.csv")> y lt; - gsub ("file_", "", x)> y [1] "a.csv" "b.csv" "c.csv"> gsub (". csv", "", y) [1] "a" "b" "c"