Cómo utilizar la función de combinación () con conjuntos de datos en r

En R se utiliza el unir() función para combinar tramas de datos. Esta poderosa función intenta identificar las columnas o filas que son comunes entre las dos tramas de datos diferentes.

Video: Como combinar funciones en Excel - Capítulo 68

Cómo utilizar la combinación para encontrar la intersección de los datos

La forma más simple de unir() se encuentra la intersección entre dos conjuntos diferentes de datos. En otras palabras, para crear un marco de datos que consiste en aquellos estados que son fríos, así como grande, utilice la versión predeterminada de unir():

gt; Merge (cold.states, large.states) Nombre de la helada Alaska Area1 152 5664322 166 1037663 Colorado Montana 155 1455874 188 109889 Nevada

Si está familiarizado con un lenguaje de base de datos como SQL, puede haber adivinado que unir() es muy similar a una base de datos se unen. Esta es, de hecho, el caso y los argumentos a diferentes unir() le permiten realizar Uniones Naturales, así como izquierda, derecha, y se une externa completa.

Video: DIFERENCIA ENTRE PERMUTACIONES Y COMBINACIONES

los unir() función toma un número bastante grande de argumentos. Estos argumentos pueden parecer bastante intimidante hasta que se da cuenta de que forman un menor número de argumentos relacionados:

  • x: Una trama de datos.

  • y: Una trama de datos.

  • por, by.x, by.y: Los nombres de las columnas que son comunes a ambos x y y. El valor por defecto es el uso de las columnas con los nombres comunes entre las dos tramas de datos.

  • todo, all.x, all.y: valores lógicos que especifican el tipo de combinación. El valor por defecto es todo = FALSE (Lo que significa que sólo se devuelven las filas coincidentes).

Ese último grupo de argumentos - todas, all.x y aliado - merece alguna explicación. Estos argumentos determinan el tipo de combinación que va a pasar.

¿Cómo entender los diferentes tipos de fusión

los unir() función permite cuatro modos de combinar datos:

  • Natural unirse: Para mantener sólo las filas que coinciden de las tramas de datos, especifique el argumento todo = FALSE.

    Video: Cómo utilizar calculadora CASIO para cálculos de combinatoria

  • externa completa: Para mantener todas las filas de ambas tramas de datos, especifique todo = TRUE.

  • Izquierda combinación externa: Para incluir todas las filas de la trama de datos x y sólo los de y ese partido, especifique all.x = TRUE.

  • Combinación externa derecha: Para incluir todas las filas de la trama de datos y y sólo los de x ese partido, especifique all.y = TRUE.

¿Cómo encontrar la unión (unión externa completa)

Volviendo a los ejemplos de estados de Estados Unidos, para realizar una combinación completa de estados fríos y grandes, el uso unir y especificar todo = TRUE:

gt; fusionar (cold.states, large.states, todo = VERDADERO) Nombre de la helada Alaska Area1 152 5664322Arizona NA NA 1134173 California 156361 .... 13 Tejas NA 26213414Vermont 168 NA15Wyoming 173 NA

Ambas tramas de datos tienen una variable Nombre, por lo que R coincide con los casos sobre la base de los nombres de los estados. La variable escarcha proviene de la trama de datos cold.states, y la variable Zona proviene de la trama de datos large.states.

Tenga en cuenta que este realiza la fusión completa y llena las columnas con N / A valores donde no hay datos coincidentes.

Artículos Relacionados