Cómo utilizar frecuencias o densidades con sus datos en r

Al dividir los datos en intervalos de R, todavía se pierde alguna información. Sin embargo, la forma más completa de la descripción de sus datos es mediante la estimación de la la función de densidad de probabilidad (PDF) o densidad de la variable.

Si este concepto es desconocido para usted, no se preocupe. Sólo recuerde que la densidad es proporcional a la probabilidad de que cualquier valor de los datos es aproximadamente igual a ese valor. De hecho, para un histograma, la densidad se calcula a partir de los recuentos, así que la única diferencia entre un histograma con frecuencias y una con densidades, es la escala de la y-eje. Para el resto, se ven exactamente lo mismo.

Cómo crear un gráfico de densidad

Se puede estimar la función de densidad de una variable mediante el densidad() función. La salida de esta función en sí no le dice mucho, pero se puede utilizar fácilmente en una parcela. Por ejemplo, se puede obtener la densidad de la variable de kilometraje mpg Me gusta esto:

Video: ESTADISTICA, VARIABLE CONTINUA: TABLA DE FRECUENCIA, HISTOGRAMA, OJIVA Y AUTO EVALUACIÓN

gt; mpgdens lt; - densidad ($ coches mpg)

El objeto se obtiene de esta manera es una lista que contiene una gran cantidad de información que realmente no necesita mirar. Pero esa lista hace trazando la densidad tan fácil como decir “trazar la densidad”:

gt; plot (mpgdens)

La trama se ve un poco áspero en los bordes, pero lo importante es ver cómo sus datos sale. El objeto densidad se representa gráficamente como una línea, con los valores reales de sus datos en el x-eje y la densidad en la y-eje.

los mpgdens lista de objetos contiene - entre otras cosas - un elemento llamado x Y el uno y. Estos representan la x- y y-coordina para el trazado de la densidad. Cuando R calcula la densidad, la densidad() función divide los datos en un número de intervalos pequeños y calcula la densidad para el punto medio de cada intervalo. Esos puntos medios son los valores para x, y las densidades calculados son los valores para y.

Cómo trazar densidades en un histograma

Recuerde que la hist () función devuelve los recuentos para cada intervalo. Ahora la probabilidad de que un valor se encuentra dentro de un cierto intervalo es directamente proporcional a los cargos. Los más valores que tienen dentro de un cierto intervalo, mayor es la probabilidad de que cualquier valor que eligió está mintiendo en ese intervalo.

Así, en lugar de planear los recuentos en el histograma, sólo podría así representar las densidades. R hace todos los cálculos para usted - la única cosa que hay que hacer es establecer la frec argumento de hist () a FALSO, Me gusta esto:

gt; hist ($ coches mpg, col = `gris`, frec = FALSO)

Ahora la trama se verá exactamente el mismo que el de antes sólo los valores de la y-eje son diferentes. La escala de la y-eje está configurado de tal manera que se puede añadir el diagrama de densidad sobre el histograma. Para ello, se utiliza el líneas() función con el objeto de densidad como argumento.

Video: Funciones de densidad y distribución de una variable aleatoria continua

Así, se puede, por ejemplo, de lujo hasta el histograma anterior un poco más añadiendo la densidad estimada usando el siguiente código inmediatamente después del comando anterior:

gt; líneas (mpgdens)

Se ve el resultado de estos dos comandos en el lado derecho. Recuerda eso líneas() utiliza el x y y elementos del objeto de densidad mpgdens para trazar la línea.

Artículos Relacionados