Cómo probar normalidad de los datos de una manera formal en r

Los métodos gráficos para el control de normalidad de los datos en I todavía dejan mucho que su propia interpretación. Hay mucha discusión en el mundo estadística sobre el significado de estas parcelas y lo que puede ser visto como algo normal.

Si muestra alguna de estas parcelas a diez estadísticos diferentes, puede obtener diez respuestas diferentes. Eso es todo un logro cuando se espera un simple sí o no, pero los estadísticos no hacen respuestas simples.

Por el contrario, todo gira en torno a las estadísticas en la medición de la incertidumbre. Esta incertidumbre se resume en una probabilidad - a menudo se llama una p-valor - y para calcular esta probabilidad, se necesita una prueba formal.

Probablemente, la prueba más utilizada para la normalidad es la prueba de Shapiro-Wilks. La función para realizar esta prueba, convenientemente llamado shapiro.test (), No podría ser más fácil de usar. Usted da la muestra como el único argumento, como en el siguiente ejemplo:

gt; shapiro.test (beaver2 $ temp) Shapiro-Wilks normalidad testdata: beaver2 $ tempW = 0,9334, p-valor = 7.764e-05

Esta función devuelve un objeto de lista, y el valor de p está contenida en un elemento llamado Valor P.. Así, por ejemplo, puede extraer el valor de p, simplemente usando el siguiente código:

gt; resultado lt; - shapiro.test (beaver2 $ temp) gt; $ resultado Valor PD [1] 7.763782e-05

Este valor p te dice cuáles son las posibilidades de que la muestra proviene de una distribución normal. Cuanto más bajo sea este valor, menor será la probabilidad. Los estadísticos utilizan típicamente un valor de 0,05 como punto de corte, por lo que cuando el valor p es menor que 0,05, se puede concluir que la muestra se desvía de la normalidad.

Video: Pruebas de normalidad en R

En el ejemplo anterior, el valor de p es claramente inferior a 0,05 - y que no debería ser una sorpresa- la distribución de la temperatura muestra dos picos separados. Esto no es nada como la curva de campana de una distribución normal.

Cuando se elige una prueba, puede estar más interesado en la normalidad en cada muestra. Puede probar ambas muestras en una línea usando el tapply () función, así:

gt; con (castor, tapply (temp, activ, shapiro.test)

Este código devuelve los resultados de una prueba de Shapiro-Wilks de la temperatura para cada grupo especificado por la variable Activ.

Video: Pruebas de Normalidad en SPSS

La gente a menudo se refieren a la prueba de Kolmogorov-Smirnov para contrastar la normalidad. Usted lleva a cabo la prueba mediante el uso de la ks.test () la función de la base de R. Pero esta función R no es adecuado para probar la desviación de normality- se puede usar sólo para comparar diferentes distribuciones.