¿Cómo definir el modo de visualización de datos en r

UN ggplot2 geom en I dice a la trama de cómo desea mostrar sus datos. Por ejemplo, se utiliza geom_bar () para hacer un gráfico de barras. En ggplot2, se puede utilizar una variedad de Geoms predefinidas para poner a los tipos estándar de trama.

Video: Windows NetWorking - Entiende las tablas de enrutamiento en 8 minutos

A geom define el diseño de una ggplot2 capa. Por ejemplo, hay Geoms para crear gráficos de barras, diagramas de dispersión, y diagramas de línea (así como una variedad de otras parcelas).

Cada geom tiene una estadística predeterminada, y cada estadística tiene un geom por defecto. En la práctica, se tiene que especificar sólo uno de ellos.

geomDescripciónStat por defecto
geom_bar ()Gráfico de barrasstat_bin ()
geom_point ()Gráfico de dispersiónstat_identity ()
geom_line ()diagrama de línea, la conexión de observaciones en ordenado por
x-valor
stat_identity ()
geom_boxplotdiagrama de caja y bigotesstat_boxplot ()
geom_pathdiagrama Line, observaciones de conexión en orden originalstat_identity ()
geom_smoothAñadir una media alisada acondicionadostat_smooth ()
geom_histogramUn alias para geom_bar () y stat_bin ()stat_bin ()

Cómo crear un gráfico de barras usando ggplot2 en I

Para hacer un gráfico de barras se utiliza el geom_bar () función. Sin embargo, tenga en cuenta que la estadística es por defecto stat_bin (), que se utiliza para cortar sus datos en intervalos. Por lo tanto, el comportamiento predeterminado de geom_bar () es la creación de un histograma.

Por ejemplo, para crear un histograma de la profundidad de terremotos en la terremotos conjunto de datos, haga lo siguiente:

gt; ggplot (temblores, aes (x = profundidad)) + geom_bar () gt; ggplot (temblores, aes (x = profundidad)) + geom_bar (binwidth = 50)

Observe que el mapeo sólo el define x-variable del eje (en este caso, sismos de profundidad $). Un argumento útil geom_bar () es binwidth, que controla el tamaño de los contenedores que los datos se corta en.

Por lo tanto, si geom_bar () hace un histograma de forma predeterminada, ¿cómo hacer un gráfico de barras? La respuesta es que primero hay que agregar sus datos y especifique el argumento stat =”identidad” en su llamada a geom_bar ().

En el siguiente ejemplo, se utiliza agregar() para calcular el número de terremotos en diferentes estratos de profundidad:

gt; quakes.agg lt; - agregada (mag ~ ronda (profundidad, -1), los datos = terremotos, + FUN = longitud) gt; nombres (quakes.agg) lt; - c ("profundidad", "revista")

Ahora se puede trazar el objeto quakes.agg con geom_bar (STAT =”identidad”):

gt; ggplot (quakes.agg, aes (x = profundidad, y = mag)) ++ geom_bar (STAT ="identidad")

En resumen, se puede utilizar geom_bar () para crear un histograma y dejar ggplot2 resumir sus datos, o se puede pre-resumir sus datos y luego utilizar stat =”identidad” para trazar un gráfico de barras.

Como hacer un diagrama de dispersión en ggplot2

Para crear un diagrama de dispersión, se utiliza el geom_point () función. Un diagrama de dispersión crea puntos (o, a veces burbujas u otros símbolos) en el gráfico. Cada punto corresponde a una observación de los datos.

Video: Introducción a Power BI

Usted probablemente ha visto o ha creado este tipo de un millón de veces gráficas, por lo que ya se sabe que los diagramas de dispersión utilizan el sistema de coordenadas cartesianas, donde una variable se asigna a la coordenada x-eje y una segunda variable se asigna a la y-eje.

Exactamente de la misma manera, en ggplot2 se crea una correlación entre x-eje y y-las variables del Eje. Por lo tanto, para crear un gráfico de la terremotos datos, asignar terremotos $ largo al x-eje y terremotos $ lat al y-eje:

Video: 4. Beginning Data Visualization with R | Visualizing Two Categorical Variables

gt; ggplot (Quakes, aes (x = de largo, y = lat)) + geom_point ()

Cómo crear gráficos de líneas ggplot2

Para crear un gráfico de líneas, se utiliza el geom_line () función. Esta función se utiliza de una manera muy similar a geom_point (), con la diferencia que geom_line () dibuja una línea entre los puntos consecutivos en los datos.

Este tipo de gráfico es útil para los datos de series de tiempo en tramas de datos, tales como los datos de población en el conjunto de datos incorporado Longley. Para crear un gráfico de líneas de las cifras de desempleo, se utiliza la siguiente:

gt; ggplot (Longley, aes (x = Año, y = Desempleado)) + geom_line ()
Artículos Relacionados