Cómo transmitir datos a gran formato en el r

Si tienes un conjunto de datos fundida (Un conjunto de datos en formato largo), que está listo para darle forma con R. Para ilustrar que el proceso de remodelación mantiene intactos todos sus datos, tratar de reconstruir el original:

gt; dcast (mgoals, Lugar + Juego ~ variables, suma) Juego Lugar Granny Geraldine primera Gertrude1 Brujas 12 5112 Gante 4 453 segundo tercio Gante 5 264 4th Brujas 6 47

Se puede ver cómo dcast () toma una fórmula como su segundo argumento? Más sobre esto en un minuto, pero primero inspeccionar sus resultados. Debe coincidir con la trama de datos originales.

A continuación, es posible que desee hacer algo más interesante - por ejemplo, crear un resumen de lugar y reproductor.

Se utiliza el dcast () función para emitir una trama de datos fundido. Para que quede claro, se utiliza este convertir de un formato largo para un formato de ancho, pero también se puede usar esto para agregarse en formatos intermedios, similar a la forma en que funciona una tabla dinámica.

los dcast () función toma tres argumentos:

  • datos: Una trama de datos fundido.

  • fórmula: Una fórmula que especifica la forma en que desea emitir los datos. Esta fórmula toma la forma x_variable ~ y_variable. Pero se simplifica a hacer un punto. Puede utilizar múltiples x-las variables, múltiples y-variables e incluso z-variables.

  • fun.aggregate: Una función para usar si la fórmula de colada resultados en la agregación de datos (por ejemplo, longitud(), suma(), o media()).

Por lo tanto, para conseguir que el resumen de lugar contra jugador, es necesario utilizar dcast () con una fórmula de colada Lugar variables ~. Tenga en cuenta que la fórmula de colada se refiere a columnas en la trama de datos de fundido:

gt; dcast (mgoals, variables ~ lugar, suma) variable de Brujas Ghent1 Granny 18 92 Geraldine 9 63 18 11 Gertrude

Si quieres conseguir una mesa con el lugar corriendo por las filas y el jugador a través de las columnas, la fórmula debe ser de fundición Lugar variables ~:

Video: Aprenda todos los SECRETOS para Crear y Enviar Publicidad por Internet de manera simple

gt; dcast (mgoals, Lugar ~ variables, suma) Lugar Granny Geraldine Gertrude1 Brujas Gante 9182 18 9 611

En realidad es posible tener fórmulas de fundición más complicados. De acuerdo con la página de ayuda para dcast (), la fórmula de colada toma este formato:

x_variable + x_2 ~ y_variable + y_2 ~ ~ z_variable ...

Observe que puede combinar varias variables en cada dimensión con el signo más (+), Y de separar cada dimensión con una tilde (~). Además, si usted tiene dos o más tildes en la fórmula (es decir, que incluya una z-variable), el resultado será una matriz multidimensional.

Video: Samsung Galaxy J2 Prime Primeras Impresiones - Memoria Interna y RAM

Por lo tanto, para obtener un resumen de los objetivos de Lugar de encuentro, jugador (variable), Y Juego, hacer lo siguiente:

gt; dcast (mgoals, Lugar + variable de ~ Juego, suma) Lugar variable de 1º 2º 3º 4th1 Brujas Granny 12 0 0 62 Brujas Geraldine 5 0 0 43 Brujas Gertrude 11 0 0 74 Gante Granny 0 4 5 05 Gante Geraldine 0 4 2 06 Gante Gertrude 0 5 6 0

Una de las razones por las que usted debe entender los datos en formato largo es que los dos paquetes de gráficos enrejado y ggplot2 hacer un uso extensivo de los datos de formato largo. La ventaja es que se puede crear fácilmente gráficos de sus datos que compara los diferentes subgrupos.

gt; biblioteca (ggplot2) gt; ggplot (mgoals, aes (x = variable y = valor, llenar = Game)) + geom_bar ()
Artículos Relacionados