¿Cómo dividir cadenas en r
Una colección de letras y palabras combinadas se llama cuerda. Cuando usted trabaja con el texto, tiene que ser capaz de concatenar palabras (cadena de ellos juntos) y ellos se separaron. En R, se utiliza el pegar() funcionar para concatenar y la strsplit () funcionar para dividir. En esta sección le mostramos cómo utilizar ambas funciones.
En primer lugar, crear un vector personaje llamado pangrama, y asignarle el valor "El rápido zorro marrón salta sobre el perro perezoso", como sigue:
> Pangrama lt; - "El rápido zorro marrón salta sobre el perro perezoso"> pangrama [1] "El rápido zorro marrón salta sobre el perro perezoso"
Para dividir el texto en el límites de las palabras (espacios), puede utilizar strsplit () como sigue:
> Strsplit (pangrama, "") [[1]] [1] "El" "rápido" "marrón" "zorro" "salta" "sobre" "el" "perezoso" "perro"
Observe que la primera línea de inusual strsplit ()'s salida consiste en [[1]]. Similar a la forma en que R muestra vectores, [[1]] R significa que está mostrando el primer elemento de una lista. Las listas son conceptos muy importantes en R- que permiten combinar todo tipo de variables.
En el ejemplo anterior, esta lista tiene un solo elemento. Sí, es cierto: La lista tiene un elemento, pero ese elemento es un vector.
Para extraer un elemento de una lista, usted tiene que utilizar dobles corchetes. Divida su pangrama en palabras, y asignar el primer elemento a una nueva variable llamada palabras, utilizando doble cuadrados paréntesis ([[]]) De subconjuntos, como sigue:
palabras lt; - strsplit (pangrama, "") [[1]]> palabras [1] "El" "rápido" "marrón" "zorro" "salta" "sobre" "el" perro "perezoso" ""
Para encontrar los elementos únicos de un vector, incluyendo un vector de texto, se utiliza el único () función. En la variable palabras, "el" aparece dos veces: una en minúsculas y una vez con la primera letra en mayúscula. Para obtener una lista de las palabras únicas, primero convierta palabras a minúsculas y luego usar único:
> Único (tolower (palabras)) [1] "el" rápido "" marrón "" zorro "," saltos "" "sobre" "perezoso" [8] "perro"