¿Cómo dividir cadenas en r

Una colección de letras y palabras combinadas se llama cuerda. Cuando usted trabaja con el texto, tiene que ser capaz de concatenar palabras (cadena de ellos juntos) y ellos se separaron. En R, se utiliza el pegar() funcionar para concatenar y la strsplit () funcionar para dividir. En esta sección le mostramos cómo utilizar ambas funciones.

En primer lugar, crear un vector personaje llamado pangrama, y asignarle el valor "El rápido zorro marrón salta sobre el perro perezoso", como sigue:

> Pangrama lt; - "El rápido zorro marrón salta sobre el perro perezoso"> pangrama [1] "El rápido zorro marrón salta sobre el perro perezoso"

Para dividir el texto en el límites de las palabras (espacios), puede utilizar strsplit () como sigue:

> Strsplit (pangrama, "") [[1]] [1] "El" "rápido" "marrón" "zorro" "salta" "sobre" "el" "perezoso" "perro"

Observe que la primera línea de inusual strsplit ()'s salida consiste en [[1]]. Similar a la forma en que R muestra vectores, [[1]] R significa que está mostrando el primer elemento de una lista. Las listas son conceptos muy importantes en R- que permiten combinar todo tipo de variables.

En el ejemplo anterior, esta lista tiene un solo elemento. Sí, es cierto: La lista tiene un elemento, pero ese elemento es un vector.

Para extraer un elemento de una lista, usted tiene que utilizar dobles corchetes. Divida su pangrama en palabras, y asignar el primer elemento a una nueva variable llamada palabras, utilizando doble cuadrados paréntesis ([[]]) De subconjuntos, como sigue:

palabras lt; - strsplit (pangrama, "") [[1]]> palabras [1] "El" "rápido" "marrón" "zorro" "salta" "sobre" "el" perro "perezoso" ""

Para encontrar los elementos únicos de un vector, incluyendo un vector de texto, se utiliza el único () función. En la variable palabras, "el" aparece dos veces: una en minúsculas y una vez con la primera letra en mayúscula. Para obtener una lista de las palabras únicas, primero convierta palabras a minúsculas y luego usar único:

> Único (tolower (palabras)) [1] "el" rápido "" marrón "" zorro "," saltos "" "sobre" "perezoso" [8] "perro"



» » » » ¿Cómo dividir cadenas en r