Cómo resumir un conjunto de datos en r

Video: QUÉ ES LA ESTADÍSTICA y CÓMO SE ORGANIZA y SE REPRESENTA DATOS - EJEMPLO RESUELTO

Si necesita una visión general de un conjunto de datos, puede, por supuesto, utilizar siempre el comando R str () y mirar la estructura. Pero esto sólo se le dice algo acerca de las clases de las variables y el número de observaciones. Además, la función cabeza() le da, a lo sumo, una idea de la forma en que los datos se almacenan en el conjunto de datos.

Como llegar a la salida

Para tener una mejor idea de la distribución de las variables del conjunto de datos, puede utilizar la resumen() función como esta:

Video: Media para Datos Agrupados

gt; Resumen (coches) mpg cil am gearMin. : 10.40 min. : 4.000 auto: 13 3: 151a Qu.:15.43 primera Qu.:4.000 Manual: 19 4: 12Median: 19,20 Mediana: 6,0005: 5Mean: 20,09 decir: 6.1883rd Qu.:22.80 tercera Qu.:8.000Max. : 33.90 Max. : 8.000

los resumen() La opción funciona mejor si usted sólo tiene que utilizar de forma interactiva R en la línea de comandos para el escaneo de su conjunto de datos de forma rápida. No se debe tratar de usarlo dentro de una función personalizada que escribió usted mismo.

Video: CÁLCULO DE LA VARIANZA Y DESVIACIÓN TÍPICA CON DATOS AGRUPADOS EN INTERVALOS

La salida de la resumen() página muestra para cada variable un conjunto de estadísticas descriptivas, dependiendo del tipo de la variable:

  • Las variables numéricas: resumen() le da el rango, cuartiles, mediana y la media.

  • variables de factor: resumen() le da una tabla con las frecuencias.

  • Numéricos y de factores variables: resumen() le da el número de valores faltantes, si los hay.

  • las variables de caracteres: resumen() no le da ninguna información en absoluto, aparte de la longitud y de la clase (que es `personaje`).

Cómo solucionar un problema

¿Has visto los valores extraños para la variable cil? Una mirada rápida en el resumen se puede decir que hay gato encerrado, como, por ejemplo, el mínimo y el primer cuartil tienen exactamente el mismo valor. De hecho, la variable cil sólo tiene tres valores y sería mejor como un factor. Por lo tanto, vamos a poner esa variable fuera de su miseria:

Video: R project (español)- Estadistica Descriptiva 1

gt; coches $ cil lt; - as.factor (coches $ cyl)
Artículos Relacionados