Cómo seleccionar las variables independientes para su modelo econométrico

Una de las decisiones más importantes que hacer cuando se especifica el modelo econométrico es qué variables se incluyen como variables independientes. A continuación, se entera de lo que pueden producirse problemas si se incluyen muy pocas o demasiadas variables independientes en el modelo, y se ve cómo esta especificación errónea afecta a sus resultados.

La omisión de variables relevantes

Si una variable que pertenece en el modelo se excluye de la función de regresión estimado, el modelo está mal y puede causar sesgo en los coeficientes estimados.

Video: Estimación de Modelos de Series de Tiempo en EViews

Usted tiene un sesgo de variable omitida si una variable excluida tiene algún efecto (positivo o negativo) en la variable dependiente y se correlaciona con al menos una de las variables independientes.

La naturaleza matemática de sesgo especificación se puede expresar usando un modelo simple. Supongamos que el verdadero modelo de población está dada por

dónde x₁ y x₂ son las dos variables que afectan Y. Sin embargo, debido a la ignorancia o la falta de datos, en lugar a estimar esta regresión:

Video: ¿Cómo seleccionar un Modelo Econometrico? Gujarati-Porter

que omite x₂ a partir de las variables independientes. El valor esperado de

Video: modelos econometricos

en esta situación es

Pero esta ecuación viola el teorema de Gauss-Markov porque

La magnitud del sesgo se puede expresar como

dónde

si el efecto de x₂ en Y y

es la pendiente de esta regresión:

que captura la correlación (positiva o negativa) entre la variable (s) incluida y excluida.

Resumen de sesgo de variables omitidas
Impacto de la variable omitida en la variable dependiente	Correlación entre la variable incluida y omitía:
Positivo	Negativo
Positivo	sesgo positivo	sesgo negativo
Negativo	sesgo negativo	sesgo positivo

En la práctica, es muy probable que tenga algún sesgo de variable omitida porque es imposible de controlar por todo lo que afecta a la variable dependiente. Sin embargo, puede aumentar sus probabilidades de disminuir el sesgo de la variable omitida, evitando modelos de regresión simple (con una variable independiente) y que incluye las variables que son propensos a ser el más importante en teoría (y, posiblemente, pero no necesariamente estadísticamente) en la explicación de la variable dependiente .

Incluyendo variables irrelevantes

Si una variable no tiene cabida en el modelo y se incluye en la función de regresión estimado, el modelo se falte espacio. Si overspecify el modelo de regresión mediante la inclusión de una variable irrelevante, los coeficientes estimados siguen siendo imparcial. Sin embargo, tiene un efecto no deseado de aumentar los errores estándar de los coeficientes.

En un modelo de regresión simple (con una variable independiente), el error estándar estimado del coeficiente de regresión para x es

dónde

es la varianza estimada del error y

Video: ¿ CÓMO SELECCIONAR SOLO VARIABLES SIGNIFICATIVAS ?

es la variación total en X.

Si incluye variables independientes adicionales en el modelo, el error estándar estimado para cualquier coeficiente de regresión dada está dada por

dónde

Es la R-cuadrado de la regresión de x_k en las otras variables independientes o xs. Porque

el numerador disminuye. Una variable irrelevante no ayuda a explicar alguna de la variación de Y, así que sin una disminución en la compensación

los aumentos de error estándar.

El hecho de que el coeficiente estimado no es estadísticamente significativa no significa que sea irrelevante. Un modelo bien especificado por lo general incluye algunas variables que son estadísticamente significativos y algunos que no lo son. Además, las variables que no son estadísticamente significativa puede contribuir suficiente variación explicada a no tienen un impacto negativo en los errores estándar.