Cómo determinar una estructura de datos en r

Video: Curso R - Tipos y estructuras de datos

La primera decisión que tiene que hacer antes de analizar los datos es la forma de representar que los datos dentro R. Si los datos tiene sólo una dimensión, entonces usted ya sabe que los vectores representan este tipo de datos muy bien. Sin embargo, si los datos tiene más de una dimensión, usted tiene la opción de utilizar matrices, listas o tramas de datos. Entonces, la pregunta es: ¿Cuándo se utiliza la cual?

Matrices y matrices de dimensiones superiores son útiles cuando todos sus datos son de una sola clase - en otras palabras, todos los datos son numéricos o todos sus datos son caracteres. Si eres un matemático o estadístico, que está familiarizado con las matrices y es probable que utilice este tipo de objeto con mucha frecuencia.

Sin embargo, en muchas situaciones prácticas, tendrá los datos que tienen muchas clases diferentes - en otras palabras, tendrá una mezcla de datos numéricos y de caracteres. En este caso, es necesario utilizar cualquiera de las listas o tramas de datos.

Si usted se imagina sus datos como una sola hoja de cálculo, una trama de datos es probablemente una buena opción. Recuerde que una trama de datos es simplemente una lista de vectores con nombre de la misma longitud, que es conceptualmente muy similar a una hoja de cálculo con columnas y un encabezado de columna para cada uno.

Si está familiarizado con las bases de datos, se puede pensar en una trama de datos lo más parecido a una sola tabla de una base de datos. Las tramas de datos son tremendamente útil y, en muchos casos, será su primera elección de los objetos para almacenar sus datos.

Video: Análisis de Datos con R

Si los datos se compone de una colección de objetos pero no se puede representar que como una matriz o una trama de datos, a continuación, una lista es la opción ideal. Dado que las listas pueden contener todo tipo de otros objetos, otras listas o cuadros de datos, que son tremendamente flexible. En consecuencia, R tiene una amplia variedad de herramientas para procesar listas.

Es posible que una trama de datos es una opción muy adecuada para la mayoría de las tareas de análisis y procesamiento de datos. Es una forma muy conveniente de representar los datos, y es similar a trabajar con tablas de bases de datos. Cuando uno lee los datos de un valor separados por comas (CSV) con la función read.csv () o read.table (), R pone los resultados en una trama de datos.

ObjetoDescripcióncomentarios
vectorEl objeto de datos básico en R, que consiste en uno o más valores de
un tipo único (por ejemplo, carácter, número o entero).
Piense en esto como una sola columna o fila de una hoja de cálculo o una
columna de una tabla de base de datos.
matriz o formaciónUn objeto multidimensional de un solo tipo (conocido como
atómico). Una matriz es una matriz de dos dimensiones.
Cuando se tiene que almacenar números en muchas dimensiones, el uso
matrices.
listaLas listas pueden contener objetos de cualquier tipo.Las listas son muy útiles para almacenar colecciones de datos que
pertenecer juntos. Dado que las listas pueden contener listas, este tipo de
objeto es muy útil.
marco de datosLas tramas de datos son un tipo especial de lista con nombre, donde todo el
elementos tienen la misma longitud.
Las tramas de datos son similares a una sola hoja de cálculo o de una tabla
en una base de datos.
Artículos Relacionados