Cómo utilizar read.csv () para importar datos en r

Una de las maneras más fáciles y más confiables de la obtención de datos en R es el uso de archivos de texto, archivos CSV, en particular (valores separados por comas). El formato de archivo CSV utiliza comas para separar los diferentes elementos en una línea, y cada línea de datos se encuentra en su propia línea en el archivo de texto, lo que hace que los archivos CSV ideal para la representación de datos tabulares.

El beneficio adicional de archivos CSV es que casi todas las aplicaciones de datos soporta la exportación de datos al formato CSV. Este es ciertamente el caso de la mayoría de las aplicaciones de hoja de cálculo, como Microsoft Excel y OpenOffice Calc.

En los siguientes ejemplos, se supone que tiene un archivo CSV almacenado en una carpeta conveniente en su sistema de archivos. Para convertir una hoja de cálculo Excel en formato CSV, tiene que elegir Archivo → Guardar como, que le da la opción de guardar el archivo en una variedad de formatos.

Tenga en cuenta que un archivo CSV puede representar sólo una sola hoja de trabajo de una hoja de cálculo. Por último, asegúrese de usar la fila superior de la hoja de trabajo (fila 1) para los títulos de las columnas.

En R, se utiliza el read.csv () función para importar datos en formato CSV. Esta función tiene una serie de argumentos, pero el único argumento es esencial archivo, que especifica la ubicación y el nombre del archivo. Para leer un archivo llamado elements.csv situado en F: utilizar read.csv () con ruta de archivo:

Video: Importar datos al R

gt; elementos lt; - read.csv (file.path ("F:", "elements.csv")) Gt; str (elementos) `data.frame`: 10 obs. de 9 variables: $ Atomic.number: int 1 2 3 4 5 6 7 8 9 10 $ Nombre: Factor de W / 10 niveles "Berilio","Boro", ..: 6 5 7 1 2 3 9 10 4 8 $ Símbolo: Factor w / 10 niveles "segundo","Ser","do","F", ..: 5 6 7 2 1 3 8 10 4 9 $ Grupo: INT 1 18 1 2 13 14 15 16 17 18 $ Periodo: int 1 1 2 2 2 2 2 2 2 2 $ Block: Factor W / 2 niveles "pag","s": 2 2 2 2 1 1 1 1 1 1 $ State.at.STP: Factor w / 2 niveles "Gas","Sólido": 1 1 2 2 2 2 1 1 1 1 $ Ocurrencia: Factor w / 1 nivel "Primordial": 1 1 1 1 1 1 1 1 1 1 $ Descripción: Factor w / 6 niveles "Metal alcalino", ..: 6 5 1 2 4 6 6 6 3 5

R importa los datos en una trama de datos. Como se puede ver, este ejemplo tiene diez observaciones de nueve variables.

Observe que la opción por defecto es la de convertir las cadenas de caracteres en factores. De este modo, las columnas Nombre, Bloquear, State.At.STP, Ocurrencia, y Descripción todos se han convertido en factores. Además, observe que R convierte espacios en los nombres de columna a períodos (por ejemplo, en la columna State.At.STP).

Esta opción por defecto de la conversión de cadenas a factores cuando se utiliza read.table () puede ser una fuente de gran confusión. A menudo es mejor de importación de datos que contiene cadenas de tal manera que las cadenas no son factores convertidos, pero permanece vectores de caracteres. Para importar datos que contiene cadenas, utilice el argumento stringsAsFactors = FALSE a read.csv () o read.table ():

Video: Read CSV in to R with R studio

gt; elementos lt; - read.csv (file.path ("F:", "elements.csv"), StringsAsFactors = FALSE) gt; str (elementos) `data.frame`: 10 obs. de 9 variables: $ Atomic.number: int 1 2 3 4 5 6 7 8 9 10 $ Nombre: chr "Hidrógeno" "Helio" "Litio" "Berilio" ... $ Símbolo: CHR "MARIDO" "Él" "Li" "Ser" ... $ Grupo: INT 1 18 1 2 13 14 15 16 17 18 $ Período: INT 1 1 2 2 2 2 2 2 2 2 $ Block: chr "s" "s" "s" "s" ... $ State.at.STP: CHR "Gas" "Gas" "Sólido" "Sólido" ... $ Ocurrencia: CHR "Primordial" "Primordial" "Primordial" "Primordial" ... $ Descripción: CHR "No metal" "gas noble" "Metal alcalino" "Metal alcalinotérreo" ...

Si usted tiene un archivo en el formato de la UE (Unión Europea) (donde se utilizan comas como separadores decimales y puntos y comas se utilizan como separadores de campo), es necesario importarlo a R utilizando la read.csv2 () función.

Artículos Relacionados