Cómo modelar las relaciones de datos lineales con r

Un análisis de la varianza para los datos también se puede escribir como modelo lineal en I, donde se utiliza un factor como una variable predictora para modelar una variable de respuesta.

Por supuesto, las variables de predicción también pueden ser variables continuas. Por ejemplo, el peso de un coche, obviamente, tiene una influencia sobre el kilometraje. Pero sería bueno tener una idea acerca de la magnitud de esa influencia. Esencialmente, usted quiere encontrar la ecuación que representa la línea de tendencia. A encontrar los datos que necesita para comprobar esto en el conjunto de datos mtcars.

Video: Regresión Lineal Simple en R - Estimación del intercepto y la pendiente

¿Cómo construir un modelo lineal

los lm () función le permite especificar cualquier cosa, desde el modelo lineal más simple de modelos complejos de interacción.

Para modelar el kilometraje en función del peso de un automóvil, se utiliza el lm () función, así:

gt; Modelo lt; - lm (mpg ~ = WT, datos mtcars)

Usted suministro de dos argumentos:

  • Una fórmula que describe el modelo: Aquí, modelar la variable mpg como una función de la variable en peso.

    Video: Graficación de ecuaciones lineales (introducción)

  • Una trama de datos que contiene las variables de la fórmula: En este caso, se utiliza la trama de datos mtcars.

Puede especificar muchos modelos complejos con la interfaz de fórmula cuando se conoce su camino alrededor.

El objeto resultante es una lista con una estructura muy compleja, pero en la mayoría de los casos no es necesario que preocuparse por eso. El objeto modelo contiene una gran cantidad de información que se necesita para los cálculos de diagnóstico y nuevas predicciones.

¿Cómo extraer información del modelo

En lugar de sumergirse en el modelo mismo objeto y la búsqueda de la información en alguna parte del objeto de lista, puede utilizar algunas de las funciones que le ayudan a obtener la información necesaria a partir del modelo. Por ejemplo, se puede extraer un vector con nombre con los coeficientes del modelo utilizando el coef () función, así:

gt; coef.Model lt; - coef (Modelo) gt; coef.Model (Intercepción) wt37.285126 -5.344472

Estos coeficientes representan el origen y la pendiente de la línea de tendencia. Usted puede usar esto para trazar la línea de tendencia en un diagrama de dispersión de los datos. Esto se hace en dos pasos:

  1. Se traza el diagrama de dispersión con los datos.

    Se utiliza el trama() función para eso.

  2. Se utiliza el abline () función para dibujar la línea de tendencia sobre la base de los coeficientes.

El siguiente código le da la trama:

gt; parcela (mpg ~ = WT, datos mtcars) gt; abline (a = coef.Model [1], b = coef.Model [2])

los abline () argumento un representa la intersección, y segundo representa la pendiente de la línea de tendencia que desea trazar. Se traza una línea vertical estableciendo el argumento v a la intersección con la x-eje en su lugar. Las líneas horizontales se representan gráficamente estableciendo el argumento v a la intersección con la y-eje.

A continuación se muestra una visión general de las funciones para extraer información del modelo en sí mismo objeto. Estas funciones trabajan con diferentes objetos del modelo, incluyendo los construidos por aov () y lm ().

Muchos autores de paquetes también ofrecen las mismas funciones de los modelos construidos por las funciones de su paquete. Por lo tanto, siempre se puede tratar de utilizar estas funciones de extracción en combinación con otras funciones modelo también.

FunciónQue hace
coef ()Devuelve un vector con los coeficientes del modelo
CONFINT ()Devuelve una matriz con el límite superior e inferior de la
intervalo de confianza para cada coeficiente del modelo
equipada ()Devuelve un vector con los valores ajustados para cada
observación
derechos residuales de autor()Devuelve un vector con los residuales para cada observación
vcov ()Devuelve la matriz de varianza-covarianza para el coeficiente
Artículos Relacionados