Conceptos básicos de los tipos de datos y estructuras de programación r para análisis predictivo

En la programación R para análisis predictivo, los datos tipos a veces se confunden con los datos estructuras. Cada variable en la memoria de programa tiene un tipo de datos. Sin duda, puede llegar a tener varias variables en su programa y seguir siendo manejable. Pero que probablemente no funcionará tan bien si usted tiene cientos (o miles) de variables- que tiene que dar todas las variables un nombre para que pueda acceder a él.

Es más eficiente para almacenar todas esas variables en una colección lógica.

Tipos de datos

Al igual que otros lenguajes de programación de pleno derecho, R ofrece muchos tipos de datos y estructuras de datos. No hay necesidad de especificar el tipo que se está asignando a una variable el intérprete lo hará por ti. Sin embargo, puede especificar el tipo o convertir si la necesidad arises- esto se llama fundición. Tres tipos de datos son los siguientes:

  • Numérico: Estos son los números típicos decimales. Estos se llaman flotadores (corto para Números de punto flotante) o dobles en otros idiomas.

  • Caracteres: Estos son sus cadenas formadas con combinaciones de letras, caracteres y números. No están destinados a tener ningún significado numérico. Estos se llaman instrumentos de cuerda en otros idiomas.

  • Lógico: CIERTO o FALSO. Siempre activar estos valores en R. se llaman Estos valores booleans en otros idiomas.

La comparación de una serie de números a una serie numérica da lugar a la intérprete de la conversión de la cadena de números en una numérica y luego hacer una comparación numérica.

Ejemplos de tipos de datos son los siguientes:

gt; yo lt; - 10 # numericgt; j lt; - 10,0 # numericgt; k lt; - "10" # Charactergt; metro lt; - i == j # logicalgt; norte lt; - i == k # lógico

Después de ejecutar esas líneas de código, puede conocer sus valores y tipos mediante el uso de la str () función. Esa operación se ve así:

gt; str (i) 10GT num; str (j) 10GT num; str (k) chr "10"gt; str (m) logi TRUEgt; str (n) logi CIERTO

La expresión en el norte asignación es un ejemplo de la intérprete convertir temporalmente el tipo de datos de k en una numérico para realizar la evaluación numérica entre yo y el carácter k.

Estructuras de datos

R se necesita un lugar para almacenar los grupos de tipos de datos con el fin de trabajar con ella de manera eficiente. Estos se llaman estructuras de datos.

Un ejemplo real de este concepto es un garaje de estacionamiento: Es una estructura que almacena los automóviles de manera eficiente. Está diseñado para aparcar tantos automóviles como sea posible, y permite que los automóviles puedan entrar y salir de la estructura de manera eficiente. Además, hay otros objetos además de los automóviles deben ser estacionados en una estructura de estacionamiento.

Las estructuras de datos incluyen:

Video: Lenguaje R

  • vectores: Vectores almacenar un conjunto de valores de un único tipo de datos. Piense en ello como un pastillero semanal. Cada compartimento en el pastillero sólo puede almacenar un determinado tipo de objeto. Después de poner unas pastillas en uno de los compartimentos, todos los demás compartimentos también deben estar llenos de cero pastillas o más píldoras.

    Video: Lenguaje R

    No se puede poner monedas en la misma caja- usted tiene que utilizar un “pastillero” diferente (vector) por eso. Del mismo modo, una vez que se almacena un número en un vector, todos los valores futuros también deben ser números. De lo contrario, el intérprete convierte todos sus números de caracteres.

  • matrices: UN matriz se parece a una hoja de cálculo Excel: Esencialmente es una tabla que consta de filas y columnas. Los datos rellena las celdas vacías por fila o columna de orden, en el que se especifica al crear la matriz.

    Todas las columnas deben tener el mismo tipo de datos.

  • Las tramas de datos: Una trama de datos es similar a una matriz, excepto las columnas de una trama de datos pueden contener diferentes tipos de datos. Los conjuntos de datos utilizados en el modelado predictivo se cargan en tramas de datos y se almacenan allí para uso en el modelo.

  • factores: UN factor es como un vector con un número limitado de valores distintos. El número de valores distintos que se conoce como su nivel. Se puede utilizar para el tratamiento de los factores de una columna que tiene un número limitado y conocido de los valores como valores categóricos. Por defecto, los datos de caracteres se carga en tramas de datos como factores.

Se accede a vectores, matrices y tramas de datos mediante el uso de notación de matriz. Por ejemplo, debería escribir v [5] para acceder al quinto elemento del vector v. Para una matriz de dos dimensiones y de trama de datos, se pone en el número de fila y la columna número, separados por una coma, dentro de los corchetes. Por ejemplo, se escribe m [2,3] para acceder a la segunda fila, el valor tercera columna para la matriz metro.

Las estructuras de datos son un tema avanzado de la informática. Por ahora, estamos pegue a la práctica. Sólo recuerde que las estructuras de datos se construyeron para almacenar tipos de datos específicos y tienen funciones para la inserción de datos, eliminación y recuperación.

Artículos Relacionados