¿Cómo definir el modo de visualización de datos en la r

LA ggplot2

geom en I dice la trama cómo quiere visualizar sus datos. Por ejemplo, se utiliza geom_bar () para hacer un gráfico de barras. En ggplot2, se puede utilizar una variedad de GEOMs predefinidos para hacer tipos estándar de trama.

A geom define el diseño de una ggplot2 capa. Por ejemplo, hay GEOMs para crear gráficos de barras, diagramas de dispersión y diagramas de línea (así como una variedad de otras parcelas).

Cada geom tiene una estadística por defecto, y cada estadística tiene un geom defecto. En la práctica, hay que especificar sólo uno de ellos.

GeomDescripciónPor defecto Stat
geom_bar ()Gráfico de barrasstat_bin ()
geom_point ()Gráfico de dispersiónstat_identity ()
geom_line ()Diagrama de línea, que conecta observaciones ordenado porX-valorstat_identity ()
geom_boxplotCaja y bigote tramastat_boxplot ()
geom_pathDiagrama de Línea, observaciones de conexión en orden originalstat_identity ()
geom_smoothAñadir un medio acondicionado suavizadastat_smooth ()
geom_histogramUn alias de geom_bar () y stat_bin ()stat_bin ()

Cómo crear un gráfico de barras utilizando ggplot2 en I

Para hacer un gráfico de barras se utiliza el geom_bar () función. Sin embargo, tenga en cuenta que la estadística por defecto es stat_bin (), que se utiliza para cortar sus datos en contenedores. Por lo tanto, el comportamiento predeterminado de geom_bar () es crear un histograma.

Por ejemplo, para crear un histograma de la profundidad de terremotos en la terremotos conjunto de datos, haga lo siguiente:

> Ggplot (terremotos, aes (x = profundidad)) + geom_bar ()> ggplot (terremotos, aes (x = profundidad)) + geom_bar (binwidth = 50)

Observe que el mapeo define sólo el X-variable del eje (en este caso, sismos de profundidad $). Un argumento útil geom_bar () es binwidth, que controla el tamaño de los contenedores que sus datos se corta en.

Así que, si geom_bar () hace un histograma de forma predeterminada, ¿cómo hacer un gráfico de barras? La respuesta es que primero hay que agregar los datos, y luego especificar el argumento stat = "identidad" en su llamado a la geom_bar ().

En el siguiente ejemplo, se utiliza agregada () para calcular el número de terremotos en diferentes estratos de profundidad:

> Quakes.agg lt; - agregada (mag ~ redonda (profundidad, -1), data = terremotos, + FUN = longitud)> nombres (quakes.agg) lt; - c ("profundidad", "mag")

Ahora se puede trazar el objeto quakes.agg con geom_bar (stat = "identidad"):

> Ggplot (quakes.agg, aes (x = profundidad, y = mag)) ++ geom_bar (stat = "identidad")

En resumen, se puede utilizar geom_bar () para crear un histograma y dejar ggplot2 resumir sus datos, o usted puede pre-resumen de sus datos y luego utilizar stat = "identidad" para trazar un gráfico de barras.

imagen0.jpg

Cómo hacer un diagrama de dispersión en ggplot2

Para crear un diagrama de dispersión, se utiliza el geom_point () función. Un diagrama de dispersión crea puntos (o, a veces burbujas u otros símbolos) en el gráfico. Cada punto corresponde a una observación en sus datos.

Usted probablemente ha visto o ha creado este tipo de gráficos de un millón de veces, así que ya sabes que los diagramas de dispersión utilizan el sistema cartesiano, donde una variable se asigna a la coordenada X-eje y una segunda variable se asignan a la y-eje.

Exactamente de la misma manera, de ggplot2 se crea una asignación entre X-eje y y-variables de los ejes. Por lo tanto, para crear un gráfico de la terremotos datos, asignar terremotos $ larga al X-eje y terremotos $ lat al y-eje:

image1.jpg
> Ggplot (terremotos, aes (x = largo, y = lat)) + geom_point ()

Cómo crear gráficos de líneas ggplot2

Para crear un gráfico de líneas, se utiliza el geom_line () función. Esta función se utiliza de una manera muy similar a geom_point (), con la diferencia de que geom_line () dibuja una línea entre los puntos consecutivos en los datos.

Este tipo de gráfico es útil para los datos de series de tiempo en tramas de datos, como los datos de población del conjunto de datos integrada longley. Para crear un gráfico de líneas de las cifras de desempleo, se utiliza el siguiente:

image2.jpg
> Ggplot (Longley, aes (x = Año, y = Desempleado)) + geom_line ()



» » » » ¿Cómo definir el modo de visualización de datos en la r