El uso de regresión lineal para predecir un resultado

investigadores estadísticos utilizan a menudo una relación lineal para predecir el (promedio) valor numérico de Y para un valor dado de x usando una línea recta (llamada línea de regresión). Si conoce la pendiente y la y-intersección de la línea de regresión, a continuación, se puede conectar en un valor de x y predecir el valor medio de Y. En otras palabras, a predecir (la media) Y de X.

Si usted establece al menos una correlación moderada entre x y Y tanto a través de un coeficiente de correlación y un diagrama de dispersión, entonces usted sabe que tienen algún tipo de relación lineal.

Nunca hacer un análisis de regresión a menos que ya haya encontrado al menos una moderadamente fuerte correlación entre las dos variables. (Una buena regla general es que debe ser en o más allá, ya sea positivo o negativo 0.50.) Si los datos no se parecen a una línea, para empezar, no se debe tratar de utilizar una línea para ajustar los datos y hacer predicciones ( pero la gente todavía intentan).

Antes de seguir adelante para encontrar la ecuación para su línea de regresión, usted tiene que identificar cuál de las dos variables es x y que es Y. Al hacer correlaciones, la elección de qué variable es x y que es Y no importa, siempre y cuando usted es consistente para todos los datos. Sin embargo, durante el montaje de líneas y haciendo predicciones, la elección de x y Y hace la diferencia.

Así que, ¿cómo determinar qué variable es cuál? En general, Y es la variable que se desea predecir, y x es la variable que está utilizando para hacer esa predicción. Por ejemplo, digamos que usted está utilizando el número de veces que una población de grillos chirrido para predecir la temperatura. En este caso se hará la variable Y la temperatura, y la variable x el número de chirridos. Por lo tanto Y puede predecirse por x usando la ecuación de una línea si existe una relación lineal lo suficientemente fuerte.

Los estadísticos llaman la x-variable (grillo emite un sonido en este ejemplo) el variable explicativa, porque si x cambios, la pendiente le dice (o explica) la cantidad de Y se espera que cambie en respuesta. Por lo tanto, la Y variable se denomina variable de respuesta. Otros nombres para x y Y incluir la independiente y dependiente las variables, respectivamente.

En el caso de dos variables numéricas, se puede llegar a una línea que le permite predecir Y de X, si (y solo si) se cumplen los siguientes dos condiciones:

Video: ¿Cómo usar la función Pronosticos de Excel?

  • El diagrama de dispersión debe formar un patrón lineal.

    Video: Aplicación Regresión Lineal Múltiple

  • La correlación, r, es moderada a fuerte (típicamente más allá de 0.50 o -0.50).

    Video: Estimación y predicción con el modelo de Regresión Lineal Simple

Algunos investigadores en realidad no verifican estas condiciones antes de hacer predicciones. Sus demandas no son válidas a menos que se cumplan las dos condiciones.

Pero supongamos que la correlación es alta ¿todavía tiene que mirar en el diagrama de dispersión? Sí. En algunas situaciones, los datos tienen una forma algo curvada, sin embargo, la correlación sigue siendo fuerte- en estos casos hacer predicciones usando una línea recta sigue siendo válido. Predicciones en estos casos deben hacerse sobre la base de otros métodos que utilizan una curva en su lugar.

Artículos Relacionados