La comprensión de datos en formatos largos y anchos en r

Video: Дэвид МакКэндлесс: Красота визуализации данных

Cuando se habla de la remodelación de datos en R, es importante reconocer los datos en formatos largos y anchos. Estas metáforas visuales describen dos formas de representar la misma información. Es útil conocer estos formatos cuando se utiliza R.

Video: Descargar: Video Compressor 2017 v4.0 [Portable Español]

Se puede reconocer los datos en formato de ancho por el hecho de que las columnas representan generalmente grupos. Por lo tanto, nuestro ejemplo de los juegos de baloncesto está en formato ancho, porque hay una columna para las cestas hechas por cada uno de los participantes:

 Lugar de juego Granny Geraldine Gertrude1 primera Brujas 12 5112 Gante 4 453 segundo tercio Gante 5 264 4th Brujas 6 47

Por el contrario, tener una mirada en el formato largo de exactamente los mismos datos:

Video: Cómo exportar una tabla de Excel a Word sin modificar su formato

 Lugar de juego valor1 variable de primera Brujas Granny 122 segundo Gante Granny 43 tercera Gante Granny 54 4th Brujas Granny 65 primera Brujas Geraldine 56 2ª Gante Geraldine 47 tercera Gante Geraldine 28 cuarto Brujas Geraldine 49 primera Brujas Gertrude 1.110 segundo Gante Gertrude 511 3ª Gante Gertrude 612 cuarto Brujas Gertrude 7

Observe cómo, en el formato largo, las tres columnas de la abuela, Geraldine, y Gertrude han desaparecido. En su lugar, ahora tiene una columna llamada valor que contiene la puntuación real, y una columna llamada variable que une el marcador a cualquiera de las tres damas.

Video: Sym crox 150r Test Ride Review

Al convertir datos entre formatos largos y anchos, es importante ser capaz de distinguir variables de identificación de las variables medidas:

  • variables de identificación: Identificador o ID, las variables se identifican las observaciones. Pensar en ellos como la clave que identifica a sus observaciones. (En el diseño de la base de datos, éstos se llaman claves primarias o secundarias.)

  • Las variables medidas: Esto representa las mediciones que ha observado.

En nuestro ejemplo, las variables de identificación son Juego y Lugar de encuentro, mientras que las variables medidas son los objetivos (es decir, las columnas Abuelita, Geraldine, y Gertrude).

Artículos Relacionados