Cómo buscar texto por el patrón en r
Como cualquier lenguaje de programación, R hace que sea fácil de compilar listas de datos ordenados y ordenados. Para encontrar subcadenas, puede utilizar la grep () función, que toma dos argumentos esenciales:
patrón: El patrón que desea encontrar.
X: El vector de caracteres que desea buscar.
Supongamos que desea encontrar todos los estados que contienen el patrón Nueva. Hazlo asi:
> Grep (" Nuevo # 148 ;, state.name) [1] 29 30 31 32
El resultado de grep () es un vector numérico con las posiciones de cada uno de los componentes que contienen el patrón coincidente. En otras palabras, el componente 29a de state.name contiene la palabra Nuevo.
> State.name [29] Nueva Hampshire
¡Uf, que funcionó! Pero escribir en la posición de cada texto coincidente va a ser un montón de trabajo. Afortunadamente, puede utilizar los resultados de grep () directamente al subconjunto del vector original. Usted puede hacer esto añadiendo el argumento valor = TRUE. Prueba esto:
> Grep (" Nuevo # 148 ;, state.name, valor = TRUE) [1] " New Hampshire " " New Jersey " [3] " Nuevo México " " Nueva York "
los grep () función de mayúsculas y minúsculas - que sólo coincide con el texto en el mismo caso (mayúsculas o minúsculas) como su patrón de búsqueda. Si busca el patrón "nuevo" en minúscula, mejores resultados están vacíos:
> Grep (" # 148 ;, nueva state.name, valor = TRUE) personaje (0)