Cómo buscar varias palabras en r

Cuando se trabaja con el texto en R, es posible que necesite para encontrar palabras o patrones dentro del texto. Imagina que tienes una lista de los estados de los Estados Unidos, y quiere saber qué nombres de estado constan de dos palabras.

Para encontrar subcadenas, puede utilizar la grep () función, que toma dos argumentos esenciales:

  • patrón: El patrón que desea encontrar.

  • X: El vector de caracteres que desea buscar.

Así que, ¿cómo encontrar los nombres de todos los estados con más de una palabra? Esto es fácil cuando te das cuenta que se puede enmarcar la cuestión mediante la búsqueda de todos los estados que contienen un espacio:

> State.name [grep ("", state.name)] [1] "New Hampshire" "New Jersey" [3] "Nuevo México" "Nueva York" [5] "Carolina del Norte" "Dakota del Norte" [7 ] "Rhode Island" "Carolina del Sur" [9] "Dakota del Sur" "West Virginia"

Los resultados incluyen todos los estados que tienen nombres de dos palabras, como Nueva Jersey, Nueva York, Carolina del Norte, Dakota del Sur, y Virginia Occidental.

Se puede ver de esta lista que no hay nombres de estado que contienen Medio. Puede confirmar esto haciendo otro hallazgo:

> State.name [grep ("Este", state.name)] personaje (0)

Cuando el resultado de una operación de carácter es un vector vacío (es decir, no hay nada en ella), R representa como personaje (0). Del mismo modo, un vacío o de longitud cero, vector numérico está representada con número entero (0) o numérica (0).

R hace una distinción entre NULO y un vector vacío. NULO por lo general significa que algo no está definido. Esta es sutilmente diferente de algo que está vacío. Por ejemplo, un vector de caracteres que pasa a tener ningún elemento es todavía un vector de caracteres, representada por personaje (0).




» » » » Cómo buscar varias palabras en r