Cómo emitir datos a gran formato en el r

Si tienes un conjunto de datos fundido (un conjunto de datos en formato largo), ya está listo para remodelar con R. Para ilustrar que el proceso de remodelación mantiene todos sus datos intactos, trate de reconstruir el original:

> Dcast (mgoals, Lugar + Juego ~ variables, suma) Juego Lugar Granny Geraldine Gertrude1 primera Brujas 12 5112 segundo Gante 4 453 tercero Gante 5 264 cuarto Brujas 6 47

¿Puedes ver cómo dcast () toma una fórmula como su segundo argumento? Más sobre esto en un minuto, pero primero inspeccione sus resultados. Se debe coincidir con el marco de datos original.

A continuación, es posible que desee hacer algo más interesante - por ejemplo, crear un resumen por el lugar y el jugador.

Se utiliza el dcast () función para emitir una trama de datos fundido. Para ser claros, utiliza este convertir de un formato largo para un formato de ancho, pero también se puede usar esto para agregarse en formatos intermedios, similar a la forma en que una tabla dinámica funciona.

los dcast () función toma tres argumentos:

  • datos: Una trama de datos fundido.

  • fórmula: Una fórmula que especifica cómo desea emitir los datos. Esta fórmula toma la forma x_variable ~ y_variable. Pero se simplifica para hacer un punto. Puede utilizar múltiples X-variables múltiples y-las variables e incluso z-variables.

  • fun.aggregate: Una función que se utilizará si los resultados de la fórmula de fundición en la agregación de datos (por ejemplo, largo(), sum (), o significa ()).

Así que, para conseguir que el resumen de lugar contra jugador, es necesario utilizar dcast () con una fórmula de fundición variables ~ Lugar. Tenga en cuenta que la fórmula de fundición se refiere a las columnas en el marco de datos fundido:

> Dcast (mgoals, variables ~ Lugar, sum) Variable Brujas Ghent1 Granny 18 92 Geraldine 9 63 18 11 Gertrude

Si quieres conseguir una mesa con el lugar corriendo por las filas y el jugador a través de las columnas, su fórmula de fundición debe ser Lugar ~ variables:

> Dcast (mgoals, Lugar ~ variables, suma) Lugar Granny Geraldine Gertrude1 Brujas 18 9182 Gante 9 611

En realidad es posible tener fórmulas de fundición más complicados. De acuerdo con la página de ayuda para dcast (), la fórmula de fundición tiene este formato:

x_variable + x_2 ~ y_variable + y_2 ~ ~ z_variable ...

Observe que puede combinar varias variables en cada dimensión con el signo más (+), Y separar cada dimensión con una tilde (~). Además, si usted tiene dos o más tildes en la fórmula (es decir, que incluya una z-variable), el resultado será una matriz multidimensional.

Así que, para obtener un resumen de los objetivos por Lugar de celebración, jugador (variable), Y Juego, hace lo siguiente:

> Dcast (mgoals, Lugar + variable de ~ Juego, suma) Lugar variable de primera segunda tercera 4th1 Brujas Granny 12 0 0 62 Brujas Geraldine 5 0 0 43 Brujas Gertrude 11 0 0 74 Gante Granny 0 4 5 05 Gante Geraldine 0 4 2 06 Gante Gertrude 0 5 6 0

Una de las razones que usted debe entender los datos en formato largo es que tanto de los paquetes gráficos enrejado y ggplot2 hacer un uso extensivo de los datos a largo formato. El beneficio es que usted puede crear fácilmente gráficos de sus datos que compara los diferentes subgrupos.

imagen0.jpg
> Biblioteca (ggplot2)> ggplot (mgoals, aes (x = variable y = valor, complete = juego)) + geom_bar ()



» » » » Cómo emitir datos a gran formato en el r