Cómo evaluar los datos lineales con r

Video: Modelo de Regresión Múltiple con Rstudio

Naturalmente, R proporciona un conjunto de diferentes pruebas y medidas para evaluar qué tan bien su modelo se ajusta a los datos, así como mirar a los supuestos del modelo. Una vez más, el panorama que se presenta aquí está lejos de ser completa, pero te da una idea de lo que es posible y un punto de partida para profundizar en el tema.

¿Cómo resumir el modelo

los resumen() la función de inmediato le devuelve la prueba F para los modelos construidos con aov (). por lm () modelos, esto es ligeramente diferente. Echar un vistazo a la salida:

gt; Resumen Modelo lt; - Resumen (Modelo) gt; Model.summaryCall: lm (fórmula = mpg ~ en peso, = datos mtcars) Residuales: Min 1T Median 3T Max-4,5432 -2,3647 -0,1252 1,4096 6.8727Coefficients: Estimación Std. Error t valor Pr (gt; | t |) (Intercepción) 37,2851 1,8776 19,858 lt; 2e-16 *** en peso -5,3445 0,5591 -9,559 1.29e-10 *** --- Signif. códigos: 0 `***` 0,001 `**` 0,01 `*` 0,05 ``. 0,1 `` 1Residual error estándar: 3.046 en 30 grados de freedomMultiple R cuadrado: 0,7528, ajustado R-cuadrado: 0.7446F-estadística: 91,38 en 1 y 30 DF, p-valor: 1.294e-10

Eso es un montón de información útil. Aquí puede ver lo siguiente:

  • La distribución de los residuos, lo que le da una primera idea acerca de qué tan bien los supuestos de una bodega modelo lineal

    Video: Ecuación de correlación lineal y coeficiente de correlación (Ejercicio 1)

  • Los coeficientes acompañados por un t-test, que le dice en qué punto cada coeficiente difiere significativamente de cero

  • La medidas de bondad de ajuste R2 y el ajustado R2

  • La prueba F que le da una idea acerca de si su modelo explica una parte significativa de la varianza en los datos

    Video: Regresión Lineal Simple en R - Errores y residuales del ajuste

Se puede utilizar el coef () función para extraer una matriz con las estimaciones, errores estándar, y t-valor y el valor p para los coeficientes del objeto de resumen de esta manera:

gt; coef (Model.summary) Estimación Std. Error t valor Pr (gt; | t |) (Intercepción) 37,285126 1,877627 19,857575 8.241799e-19wt -5,344472 0,559101 -9,559044 1.293959e-10

Si estos términos no le dicen nada, mirar hacia arriba en una buena fuente sobre el modelado. Para una extensa introducción a la aplicación e interpretación de los modelos lineales correctamente, echa un vistazo Modelos estadísticos lineales Aplicada, 5ª edición, por Michael Kutner et al (McGraw-Hill / Irwin).

Cómo probar el impacto de los términos del modelo

Para obtener un análisis de varianza de mesa - como el resumen() función hace que para un modelo de ANOVA - se utiliza simplemente el anova () la función y pasarle el lm () modelo de objetos como un argumento, como este:

gt; Model.anova lt; - anova (Modelo) gt; Model.anovaAnalysis de Varianza TableResponse: valor mpgDf Sum Sq Mean Sq F Pr (gt; F) en peso 1 847.73 847.73 91.375 1.294e-10 *** Residuales 30 278,32 9,28 --- Signif. códigos: 0 `***` 0,001 `**` 0,01 `*` 0,05 ``. 0.1 `` 1

En este caso, el objeto resultante es una trama de datos que le permite extraer cualquier valor de esa tabla utilizando las herramientas de indexación y subconjuntos. Por ejemplo, para obtener el valor de p, puede hacer lo siguiente:

gt; Model.anova [ `peso`, `Pr (gt; F)`] [1] 1.293959e-10

Se puede interpretar este valor como la probabilidad de que la adición de la variable en peso al modelo no hace una diferencia. El bajo valor de p aquí indica que el peso de un coche (en peso) Explica una parte significativa de la diferencia en el kilometraje (mpg) Entre los coches. Esto no debería ser una sorpresa: un coche más pesado lo hace, de hecho, necesitan más potencia para arrastrar su propio peso alrededor.

Se puede utilizar el anova () función para comparar diferentes modelos, así, y muchos paquetes de modelado proporcionar esa funcionalidad. A encontrar ejemplos de esto en la mayoría de las páginas de ayuda relacionados, como la ?anova.lm y ?anova.glm.

Artículos Relacionados