Cómo utilizar la función de combinación () con conjuntos de datos en r

En R utiliza el merge ()

función para combinar tramas de datos. Esta potente función trata de identificar las columnas o filas que son comunes entre las dos tramas de datos diferentes.

Cómo utilizar la combinación de encontrar la intersección de los datos

La forma más simple de merge () se encuentra la intersección entre dos conjuntos diferentes de datos. En otras palabras, para crear un marco de datos que consiste en aquellos estados que son fríos, así como grandes, utilice la versión predeterminada de merge ():

> Combinar (cold.states, large.states) Nombre de Frost Area1 Alaska 152 5664322 166 1037663 Colorado Montana 155 1455874 Nevada 188 109 889

Si está familiarizado con un lenguaje de base de datos como SQL, usted puede haber adivinado que merge () es muy similar a una base de datos unirse. Esto es, de hecho, el caso y los diferentes argumentos a merge () le permiten realizar naturales se une, así como a la izquierda, derecha y combinaciones externas completas.

los merge () función toma un gran número de argumentos bastante. Estos argumentos pueden parecer bastante intimidante, hasta que te das cuenta de que forman un menor número de argumentos relacionados:

  • X: Una trama de datos.

  • y: Una trama de datos.

  • por, by.x, by.y: Los nombres de las columnas que son comunes a ambos X y y. El valor predeterminado es utilizar las columnas con los nombres comunes entre las dos tramas de datos.

  • todo, all.x, all.y: Valores lógicos que especifican el tipo de combinación. El valor por defecto es all = FALSO (lo que significa que sólo las filas coincidentes se devuelven).

El último grupo de argumentos - todas, all.x y all.y - merece una explicación. Estos argumentos determinan el tipo de mezcla que va a pasar.

¿Cómo entender los diferentes tipos de fusión

los merge () función permite cuatro modos de combinación de datos:

  • Natural unirse: Para mantener sólo las filas que coinciden de las tramas de datos, especifique el argumento all = FALSO.

  • Externa completa: Para mantener todas las filas de las dos tramas de datos, especifique all = TRUE.

  • Izquierda combinación externa: Para incluir todas las filas de la trama de datos X y sólo los de y ese partido, especifique all.x = TRUE.

  • Derecha combinación externa: Para incluir todas las filas de la trama de datos y y sólo los de X ese partido, especifique all.y = TRUE.

    imagen0.jpg

¿Cómo encontrar la unión (externa completa)

Volviendo a los ejemplos de estados de Estados Unidos, para realizar una combinación completa de los estados fríos y grandes, el uso fundirse y especificar all = TRUE:

> Merge (cold.states, large.states, todos = TRUE) Nombre de Frost Area1 Alaska 152 5664322Arizona NA 1134173 California NA 156361 .... 13 Tejas NA 26213414Vermont 168 NA15Wyoming 173 NA

Ambas tramas de datos tienen una variable Nombre, así que R coincide con los casos a partir de los nombres de los estados. La variable escarcha proviene de la trama de datos cold.states, y la variable Area proviene de la trama de datos large.states.

Tenga en cuenta que este realiza la fusión completa y llena las columnas con N / A valores donde no hay datos coincidentes.




» » » » Cómo utilizar la función de combinación () con conjuntos de datos en r