Cómo utilizar los datos en formato de altura en parcelas de celosía en r

Cuando usted tiene datos en formato de alto en R, se puede utilizar fácilmente enrejado gráficos para visualizar los subgrupos en los datos. Por ejemplo, ¿qué sucede cuando se quiere analizar más de una variable al mismo tiempo?

Considere el conjunto de datos integrada longley, que contiene datos sobre el empleo, el desempleo y otros indicadores de población:

> Str (Longley) 'data.frame': 16 obs. de 7 variables: $ GNP.deflator: num 83 88,5 88,2 89,5 96,2 ... $ PNB: num 234 259 258 285 329 ... $ Desempleado: num 236 232 368 335 210 ... $ Armed.Forces: num 159 146 162 165 310 ... $ Población: num 108 109 110 111 112 ... $ Año: int 1947 1948 1949 1950 1951 1952 1953 1954 1955 1956 ... $ Empleado: num 60,3 61,1 60,2 61,2 63,2 ...

Una forma de analizar fácilmente las diferentes variables de una trama de datos es para reformar primero la trama de datos de gran formato a formato de altura.

Una trama de datos amplia contiene una columna para cada variable. Una trama de datos de altura contiene toda la misma información, pero los datos se organiza de tal manera que una columna se reserva para identificar el nombre de la variable y una segunda columna contiene los datos reales.

Una manera fácil de remodelar una trama de datos de gran formato a formato de altura es utilizar el derretir() función en el reshape2 paquete. Recuerda: reshape2 no es parte de la base R - es un paquete de complemento que está disponible en CRAN. Se puede instalar con el install.packages ("reshape2") función.

> Biblioteca ("reshape2")> mlongley lt; - fundir (Longley, id.vars = "Año")> str (mlongley) 'data.frame': 96 obs. de 3 variables: $ Año: int 1947 1948 1949 1950 1951 1952 1953 1954 1955 1956 ... $ variables: Factor w / 6 niveles "GNP.deflator", ..: 1 1 1 1 1 1 1 1 1 1 .. . $ valor: num 83 88,5 88,2 89,5 96,2 ...

Ahora se puede trazar la trama de datos de altura mlongley y el uso de las nuevas columnas valor y variable en la fórmula valor ~ Año | variable.

> Xyplot (valor ~ Año | = variables, datos = mlongley, + diseño c (6, 1), + par.strip.text = lista (cex = 0,7), + escalas = lista (cex = 0,7) +)

Los argumentos adicionales par.strip.text y escamas controlar el tamaño de la fuente (relación de expansión de caracteres) de la tira en la parte superior del gráfico, así como la escala.

Al crear parcelas con múltiples grupos, asegúrese de que la parcela resultante es significativa. Por ejemplo, la unidad del PNB (abreviatura de Producto nacional bruto) Es probablemente miles de millones de dólares. En contraste, la unidad de población es probablemente millones de personas. (La documentación de la longley conjunto de datos no está claro en este tema.)

Tenga mucho cuidado cuando se presente parcelas como esto - usted no quiere ser acusado de crear tabla de basura (engañosa gráficos).

imagen0.jpg


» » » » Cómo utilizar los datos en formato de altura en parcelas de celosía en r