¿Cómo describir la variación de los datos en r

Video: Desviación Estándar como interpretar su significado

Un solo número no dice mucho acerca de sus datos. A menudo es tan importante conocer la difusión de sus datos. Puede utilizar R para mirar a esta extensión utilizando una serie de enfoques diferentes.

Video: R 01 Creacion de variables

En primer lugar, se puede calcular ya sea el diferencia o el desviación estándar para resumir la propagación en un solo número. Para ello, dispone de las funciones convenientes var () de la varianza y Dakota del Sur() para la desviación estándar. Por ejemplo, se calcula la desviación estándar de la variable mpg en la trama de datos carros Me gusta esto:

gt; SD ($ coches mpg) [1] 6.026948

Al lado de la media y la variación, también puede echar un vistazo a los cuantiles. UN cuantil, o percentil, le indica la cantidad de los datos se encuentra por debajo de un cierto valor. El 50 por ciento cuantil, por ejemplo, no es más que la mediana. Una vez más, R tiene algunas funciones convenientes para ayudarle con el examen de los cuantiles.

Video: Variables Cualitativas en R

¿Cómo calcular el rango de datos en R

Los cuantiles más utilizados son en realidad los cuantiles 0 y 100 por ciento. Usted podría fácilmente llamar el mínimo y el máximo, porque eso es lo que son. Usted puede obtener tanto min () y max () funciones juntos utilizando la distancia() función. Esta función convenientemente le da el rango de los datos. Así, a saber, entre los cuales dos valores de todos los kilometrajes están situados, sólo tiene que hacer lo siguiente:

gt; rango ($ coches mpg) [1] 10,4 33,9

Cómo calcular los datos cuartiles en I

La gama todavía le da información limitada. A menudo, los estadísticos reportar el primero y el tercero cuartilla próximo a la gama y la mediana. Estos cuartiles son, respectivamente, los cuantiles 25 por ciento y 75 por ciento, que son los números para los que una cuarta parte y tres cuartas partes de los datos es menor. Obtener estos números utilizando la cuantil () función, así:

gt; cuantil ($ coches mpg) 0% 25% 50% 75% 100% 10.400 15.425 19.200 22.800 33.900

Los cuartiles no son los mismos que la bisagra inferior y superior calculado en el resumen de cinco números. Los dos últimos son, respectivamente, la mediana de la mitad inferior y superior de sus datos, y difieren ligeramente de los primer y tercer cuartil. Para obtener las estadísticas de número cinco, se utiliza el fivenum () función.

Video: RENOMBRAR VARIABLES - R Project

Como llegar en la velocidad con la función cuantil en I

los cuantil () función le puede dar cualquier cuantil desea. Para ello, se utiliza el hubieron problemas argumento. Usted da la hubieron problemas (O probabilidades) como un número fraccionario. Para el cuantil del 20 por ciento, por ejemplo, se utiliza 0.20 como un argumento para el valor. Este argumento también tiene un vector como un valor, por lo que puede, por ejemplo, obtener las 5 por ciento y el 95 por ciento de los cuantiles de esta manera:

gt; cuantil (coches $ MPG, probs = c (0,05, 0,95)) 5% 95% 11,995 31,300

El valor por defecto para el hubieron problemas argumento es un vector que representa el mínimo (0), el primer cuartil (0.25), la mediana (0,5), el tercer cuartil (0,75), y el máximo (1).

Todas estas funciones tienen un argumento na.rm que le permite eliminar todos N / A Los valores antes de calcular la estadística respectiva. Si no se hace esto, cualquier vector que contiene N / A tendrá N / A como resultado. Esto funciona de forma idéntica a la na.rm argumento de la suma() función.

Artículos Relacionados