Cómo mirar la estructura de un factor de r

R tiene una estructura de datos especial para los datos categóricos, llamados factores. Factores están estrechamente relacionados con los personajes, ya que cualquier vector de caracteres puede ser representado por un factor. Para mirar un poco debajo de la capilla de la estructura de un factor, utilice el str () función:

Video: Las Leyes de Newton

gt; str (state.region) Factor w / 4 niveles "Nordeste","Sur"..: 2 4 4 2 4 4 1 2 2 2 ...

R reporta la estructura de state.region como un factor con cuatro niveles. Se puede ver que los dos primeros niveles son "Nordeste" y "Sur", pero estos niveles se representan como números enteros 1, 2, 3 y 4.

Factores son una forma conveniente para describir los datos categóricos. Internamente un factor se almacena como un valor numérico asociado a cada nivel. Esto significa que puede establecer e investigar los niveles de un factor por separado de los valores del factor.

Para ver los niveles de un factor, se utiliza el niveles () función. Por ejemplo, para extraer los niveles de factor de state.region, utilice la siguiente:

Video: Determinación de la relación arista-radio

gt; niveles (state.region) [1] "Nordeste" "Sur"[3] "norte central" "Oeste"

Debido a que los valores del factor están vinculados a los niveles, al cambiar los niveles, también cambia indirectamente los propios valores. Para aclarar esto, cambiar los niveles de state.region a los valores "NORDESTE", “S”, "CAROLINA DEL NORTE", y “W”:

gt; niveles (state.region) lt; - c ("nordeste", "S", "CAROLINA DEL NORTE", "W") Gt; cabeza (state.region) [1] WLevels S W W S W: NE S NC W

A veces es útil saber el número de niveles de un factor. La función de conveniencia NLEVELS () extrae el número de niveles de un factor:

gt; NLEVELS (state.region) [1] 4

Debido a que los niveles de un factor se almacenan internamente por R como un vector, también puede extraer el número de niveles usando longitud:

Video: Factor Empaquetamiento

gt; longitud (niveles (state.region)) [1] 4

Por la misma razón, se puede indexar los niveles de un factor usando las reglas del vector subsistentes estándar. Por ejemplo, para extraer el segundo y tercer niveles de factor, utilizar lo siguiente:

gt; niveles (state.region) [2: 3] [1] "S" "CAROLINA DEL NORTE"
Artículos Relacionados