Cómo utilizar parcelas de cuantiles para comprobar la normalidad de datos en r

Histogramas dejan mucho a la interpretación del espectador. Una mejor manera gráfica en I de saber si sus datos se distribuyen normalmente es buscar en una parcela denominada cuantil-cuantil (QQ).

Con esta técnica, se trazan los cuantiles uno contra el otro. Si se compara dos muestras, por ejemplo, sólo tiene que comparar los cuantiles de ambas muestras. O, para decirlo de manera un poco diferente, R hace lo siguiente para construir una trama QQ:

  • Se ordena los datos de ambas muestras.

  • Traza estos valores ordenados uno contra el otro.

Si ambas muestras no contienen el mismo número de valores, R calcula los valores adicionales por interpolación para la muestra más pequeña para crear dos muestras del mismo tamaño.

Cómo comparar dos muestras de datos

Por supuesto, usted no tiene que hacerlo todo por sí mismo, sólo tiene que utilizar el qqplot () función para eso. Por lo tanto, para comprobar si las temperaturas durante la actividad y durante el resto se distribuyen por igual, sólo tiene que hacer lo siguiente:

gt; qqplot (beaver2 $ temp [beaver2 $ activ == 1], + beaver2 $ temp [beaver2 $ activ == 0])

Esto crea una parcela en la que los valores ordenados se trazan unos contra otros.

Entre los corchetes, se puede usar un vector lógico seleccionar los casos que desee. Aquí se selecciona todos los casos en los que la variable Activ es igual 1 para la primera muestra, y todos los casos en que la variable es igual 0 para la segunda muestra.

Cómo utilizar una parcela R QQ para comprobar la normalidad de los datos

En la mayoría de los casos, usted no desea comparar dos muestras entre sí, pero comparar una muestra con una muestra teórica que proviene de una cierta distribución (por ejemplo, la distribución normal).

Video: Test de Normalidad de Jarque Bera

Para hacer un diagrama QQ esta manera, R tiene el especial qqnorm () función. Como su nombre lo indica, esta función dibuja su muestra en contra de una distribución normal. Simplemente da la muestra que desea trazar como primer argumento y añadir los parámetros gráficos que te gusta.

R crea entonces una muestra con los valores procedentes de la estándar distribución normal, o una distribución normal con una media de cero y una desviación estándar de uno. Con esta segunda muestra, R crea la trama QQ como se ha explicado antes.

Video: Test de Normalidad de Shapiro Wlik

R también tiene una qqline () función, lo que añade una línea a su parcela QQ normal. Esta línea hace que sea mucho más fácil de evaluar si se ve una clara desviación de la normalidad. Cuanto más cerca de todos los puntos se encuentran a la línea, cuanto más cerca la distribución de la muestra viene a la distribución normal. los qqline () función también toma la muestra como un argumento.

Ahora quiere hacer esto para las temperaturas durante tanto el activo y el período de inactividad del castor. Se puede utilizar el qqnorm () funcionar dos veces para crear las dos parcelas. Para los períodos inactivos, puede utilizar el siguiente código:

gt; qqnorm (beaver2 $ temp [beaver2 $ activ == 0], la principal = `Inactivo`) gt; qqline (beaver2 $ temp [beaver2 $ activ == 0])

Puede hacer lo mismo para el período activo cambiando el valor 0 a 1.

Artículos Relacionados