Como llegar geoms en ggplot en r
Video: ggplot2: geom_point
UN ggplot2 geom dice la trama cómo desea mostrar los datos en R. Por ejemplo, se utiliza geom_bar () para hacer un gráfico de barras. En ggplot2, se puede utilizar una variedad de Geoms predefinidas para poner a los tipos estándar de trama.
A geom define el diseño de una ggplot2 capa. Por ejemplo, puede utilizar Geoms para crear gráficos de barras, diagramas de dispersión, y diagramas de línea (así como una variedad de otras parcelas), como se puede ver a continuación.
Cada geom tiene una estadística predeterminada, y cada estadística tiene un geom por defecto. En la práctica, se tiene que especificar sólo uno de ellos.
geom | Descripción | Stat por defecto |
---|---|---|
geom_bar () | Gráfico de barras | stat_bin () |
geom_point () | Gráfico de dispersión | stat_identity () |
geom_line () | diagrama de línea, la conexión de las observaciones con el fin de x-valor | stat_identity () |
geom_boxplot | diagrama de caja y bigotes | stat_boxplot () |
geom_path | diagrama Line, observaciones de conexión en orden original | stat_identity () |
geom_smooth | Añadir una media alisada acondicionado | stat_smooth () |
geom_histogram | Un alias para geom_bar () y stat_bin () | stat_bin () |
La creación de un gráfico de barras
Para hacer un gráfico de barras, se utiliza el geom_bar () función. Sin embargo, tenga en cuenta que la estadística es por defecto stat_bin (), que se utiliza para cortar sus datos en intervalos. Por lo tanto, el comportamiento predeterminado de geom_bar () es la creación de un histograma.
Por ejemplo, para crear un histograma de la profundidad de terremotos en la terremotos conjunto de datos, trate de:
gt; ggplot (temblores, aes (x = profundidad)) + geom_bar () gt; ggplot (temblores, aes (x = profundidad)) + geom_bar (binwidth = 50)
Observe que el mapeo sólo el define x-variable del eje (en este caso, sismos de profundidad $). Un argumento útil geom_bar () es binwidth, que controla el tamaño de los contenedores que los datos se corta en. Esto crea esta parcela.
Video: R Tutorials - Learn ggplot2
Por lo tanto, si geom_bar () hace un histograma de forma predeterminada, ¿cómo hacer un gráfico de barras? La respuesta es que primero hay que agregar sus datos y especifique el argumento stat =“identidad” en su llamada a geom_bar ().
En el siguiente ejemplo, se utiliza agregar() para calcular el número de terremotos en diferentes estratos de profundidad:
> quakes.agg <- aggregate(mag ~ round(depth, -1), data = quakes,+ FUN = length)> nombres (quakes.agg) <- c(“depth”, “mag”)
Ahora se puede trazar el objeto quakes.agg con geom_bar (STAT =“identidad”):
> Ggplot (quakes.agg, aes (x = profundidad, y = mag)) ++ geom_bar (STAT = “identidad”)
En resumen, se puede utilizar geom_bar () para crear un histograma y dejar ggplot2 resumir los datos, o puede resumir sus datos y luego utilizar stat =“identidad” para trazar un gráfico de barras.
Video: ggplot scatterplots in R
Hacer un diagrama de dispersión
Para crear un diagrama de dispersión, se utiliza el geom_point () función. Un diagrama de dispersión crea puntos (o, a veces burbujas u otros símbolos) en el gráfico. Cada punto corresponde a una observación de los datos.
Video: ggplot2 tutorial: Statistics outside Geoms
Usted probablemente ha visto o ha creado este tipo de un millón de veces gráficas, por lo que ya se sabe que los diagramas de dispersión utilizan el sistema de coordenadas cartesianas, donde una variable se asigna a la coordenada x-eje y una segunda variable se asigna a la y-eje.
Exactamente de la misma manera, en ggplot2 se crea una correlación entre x-eje y y-las variables del Eje. Por lo tanto, para crear un gráfico de la terremotos datos, asignar terremotos $ largo al x-eje y terremotos $ lat al y-eje:
> Ggplot (temblores, aes (x = de largo, y = lat)) + geom_point ()
Esto crea este diagrama de dispersión.
La creación de gráficos de líneas
Para crear un gráfico de líneas, se utiliza el geom_line () función. Esta función se utiliza de una manera muy similar a geom_point ()- la diferencia es que geom_line () dibuja una línea entre los puntos consecutivos en los datos.
Este tipo de gráfico es útil para los datos de series de tiempo en tramas de datos, tales como los datos de población en el conjunto de datos incorporado Longley. Para crear un gráfico de líneas de las cifras de desempleo, se utiliza la siguiente:
gt; ggplot (Longley, aes (x = Año, y = Desempleado)) + geom_line ()
Esto crea esta línea.
Puede utilizar cualquiera geom_line () o geom_path () para crear un dibujo lineal en ggplot2. La diferencia es que geom_line () primeras órdenes las observaciones de acuerdo con x-valor, mientras geom_path () dibuja las observaciones en el orden que se encuentra en los datos.
">