Utilice gráficos de dispersión para identificar una relación lineal en el análisis de regresión simple

UN gráfico de dispersión es un tipo especial de gráfico diseñado para mostrar la relación entre dos variables. Con el análisis de regresión, se puede utilizar un gráfico de dispersión para inspeccionar visualmente los datos para ver si x y Y están relacionadas linealmente. Los siguientes son algunos ejemplos.

Esta figura muestra un gráfico de dispersión de dos variables que tienen una relación no lineal entre ellos.

gráfico de dispersión de una relación no lineal.
gráfico de dispersión de una relación no lineal.

Cada punto en el gráfico representa un único (x, Y) par. Debido a que el gráfico no es una línea recta, la relación entre x y Y es no lineal. Nótese que a partir de los valores más negativos de x, como x aumenta, Y en primera Disminuciones- entonces como x continúa en aumento, Y aumenta. El gráfico muestra claramente que la pendiente es continuamente changing- no es una constante. Con una relación lineal, la pendiente no cambia nunca.

En este ejemplo, una de las premisas fundamentales del análisis de regresión simple es violada, y que necesita otro enfoque para estimar la relación entre x y Y. Una posibilidad es transformar la variables- por ejemplo, podría ejecutar una regresión simple entre ln (x) Y ln (Y). ( “Ln” significa el logaritmo natural.) A menudo, esto ayuda a eliminar la no linealidad en la relación entre x y Y. Otra posibilidad es utilizar un tipo más avanzado de análisis de regresión, que puede incorporar relaciones no lineales.

Esta figura muestra un gráfico de dispersión de dos variables que tienen una relación lineal fuertemente positiva entre ellos. La correlación entre x y Y es igual a 0,9.

Diagrama de dispersión de una relación lineal fuertemente positiva.
Diagrama de dispersión de una relación lineal fuertemente positiva.

La figura muestra una tendencia muy fuerte para x y Y tanto a elevarse por encima de sus medios o caída por debajo de sus medios al mismo tiempo. La línea recta es una La línea de tendencia, diseñado para acercarse lo más posible a todos los puntos de datos. La línea de tendencia tiene una pendiente positiva, que muestra una relación positiva entre x y Y. Los puntos en la gráfica están estrechamente agrupados acerca de la línea de tendencia debido a la fuerza de la relación entre x y Y. (Nota: La pendiente de la línea no es 0.9- 0.9 es la correlación entre x y Y.)

La siguiente figura muestra un diagrama de dispersión para dos variables que tienen una relación lineal débilmente positiva entre ellos- la correlación entre x y Y es igual a 0,2.

Diagrama de dispersión de una relación lineal débilmente positivo.
Diagrama de dispersión de una relación lineal débilmente positivo.

Esta figura muestra una conexión débil entre x y Y. Tenga en cuenta que los puntos de la gráfica son más dispersos sobre la línea de tendencia que en la figura anterior, debido a la relación más débil entre x y Y.

La siguiente figura es un gráfico de dispersión de dos variables que tienen una relación lineal fuertemente negativa entre ellos- la correlación entre x y Y es igual a -0,9.

Video: Fundamentos sobre regresión lineal, PARTE 3: Diagrama de dispersión y mínimos cuadrados

Diagrama de dispersión de una relación lineal fuertemente negativa.
Diagrama de dispersión de una relación lineal fuertemente negativa.

Esta figura muestra una tendencia muy fuerte para x y Y para moverse en direcciones- opuesto por ejemplo, se elevan por encima o caen por debajo de sus medios a veces opuestos. La línea de tendencia tiene una pendiente negativa, lo que muestra una relación negativa entre x y Y. Los puntos en la gráfica están estrechamente agrupados acerca de la línea de tendencia debido a la fuerza de la relación entre x y Y.

La siguiente figura es un gráfico de dispersión de dos variables que tienen una relación lineal débilmente negativa entre ellos. La correlación entre x y Y es igual a -0,2.

Diagrama de dispersión de una relación lineal débilmente negativo.
Diagrama de dispersión de una relación lineal débilmente negativo.

Video: Análisis de regresión lineal simple con Infostat

Esta figura muestra una conexión muy débil entre x y Y. Tenga en cuenta que los puntos de la gráfica son más dispersos sobre la línea de tendencia que en la figura anterior, debido a la relación más débil entre x y Y.

Artículos Relacionados