¿Cómo eliminar los datos duplicados en r
Video: Cómo eliminar datos repetidos con excel
Una aplicación muy útil de subconjuntos de datos es encontrar y eliminar valores duplicados. R tiene una función útil, duplicada (), que encuentra valores duplicados y devuelve un vector lógico que indica si el valor específico es un duplicado de un valor anterior. Esto significa que para valores duplicados, duplicada () devoluciones FALSO para la primera ocurrencia y CIERTO para cada siguiente ocurrencia de ese valor, como en el siguiente ejemplo:
Video: Como Eliminar Los Archivos Duplicados de tu Android - 2016
gt; duplicada (c (1,2,1,3,1,4)) [1] FALSO FALSE FALSE TRUE TRUE FALSE
Si intenta esto en un marco de datos, R comprueba automáticamente las observaciones (es decir, se trata a cada fila como un valor). Así, por ejemplo, con la trama de datos iris:
gt; duplicada (iris) [1] FALSO FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE [10] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSO .... [136] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE TRUE [145] FALSE FALSE FALSE FALSE FALSE FALSE
Si se fijan bien, observa que la fila 143 es un duplicado (ya que el elemento 143 de su resultado tiene el valor CIERTO). También se puede decir esto por el uso de la cual() función:
Video: Como eliminar filas duplicadas en Excel - Capítulo 141
gt; que (duplicado (iris)) [1] 143
Ahora, para eliminar el duplicado de iris, necesita excluir esta fila de sus datos. Recuerde que hay dos formas de excluir el uso de subconjuntos de datos:
Video: Tutorial Excel (Cap. 64) Eliminar Datos Repetidos o Duplicados
Especificar un vector lógico, donde FALSO significa que el elemento será excluido. los ! (Signo de exclamación) operador es una negación lógica. Esto significa que se convierte CIERTO dentro FALSO y viceversa. Por lo tanto, para eliminar los duplicados de iris, hacer lo siguiente:
gt; Iris [! duplicado (iris),]
Especificar valores negativos. En otras palabras:
gt; índice lt; - que (duplicado iris) () gt; iris [-índice,]
En ambos casos, se dará cuenta de que su instrucción se ha eliminado la fila 143.