La aplicación de métodos estadísticos a los problemas económicos

Econometría estudiantes siempre aprecian una revisión de los conceptos estadísticos que son más importantes para tener éxito con la econometría. En concreto, tiene que ser cómodo con distribuciones de probabilidad, el cálculo de las estadísticas descriptivas y contrastes de hipótesis.

Su capacidad de cuantificar con precisión las relaciones económicas no sólo depende de sus habilidades de construcción de modelos econométricos, sino también en la calidad de los datos que está utilizando para su análisis y su capacidad para adoptar las estrategias adecuadas para la estimación de modelos que puedan violar una hipótesis estadística . Los datos deben ser derivadas de un proceso de recogida fiable, sino que también deben ser conscientes de las limitaciones o dificultades adicionales.

Ellos pueden incluir, pero no se limitan a

La agregación de los datos: La información que puede tener su origen en un hogar, individual o de nivel de empresa se mide a una ciudad, condado, estado o país en el nivel de sus datos.
Estadísticamente correlacionados pero económicamente irrelevantes variables: Algunos conjuntos de datos contienen una gran cantidad de información, pero muchas de las variables pueden no tener nada que ver con la cuestión económica que está esperando para hacer frente.
Datos cualitativos: conjuntos de datos ricos suelen incluir variables cualitativas (información geográfica, raza, etc.), pero esta información requiere un tratamiento especial antes de poder utilizarlo en un modelo econométrico.
Classical modelo de regresión lineal (CLRM) fracaso suposición: La legitimidad de su enfoque econométrico siempre se basa en un conjunto de supuestos estadísticos, pero es muy probable que encuentre que al menos uno de estos supuestos no se sostiene (lo que significa que no es cierto para sus datos).

Económetras se diferencian de los estadísticos, haciendo hincapié en violaciónes de las hipótesis estadísticas que a menudo se dan por sentado. La técnica más común para la estimación de un modelo econométrico es mínimos cuadrados ordinarios (MCO). Sin embargo, una serie de supuestos CLRM debe tener a fin de que la técnica OLS para proporcionar estimaciones fiables. En la práctica, los supuestos que son más propensos a fallar dependen de sus datos y aplicaciones específicas.

Reconociendo la importancia del tipo de datos, la frecuencia y la agregación

Los datos que se utiliza para estimar y probar el modelo econométrico se suelen clasificar en uno de los tres tipos posibles:

sección transversal: Este tipo de datos se compone de mediciones para las observaciones individuales (personas, hogares, empresas, condados, estados, países, o lo que sea) en un punto dado en el tiempo.
Series de tiempo: Este tipo de datos se compone de mediciones en una o más variables (tales como el producto interno bruto, tasas de interés, o las tasas de desempleo) con el tiempo en un espacio determinado (como un país específico o estado).
Video: Teoría - Estadística Básica - Introducción - Series temporales
Panel o longitudinal: Este tipo de datos se compone de una serie de tiempo para cada unidad de la sección transversal en la muestra. Los datos contienen mediciones para las observaciones individuales (personas, hogares, empresas, condados, estados, países, etc.) durante un período de tiempo (días, meses, trimestres o años).

El tipo de datos que está utilizando puede influir en cómo a estimar el modelo econométrico. En particular, las técnicas especializadas suelen ser necesarios para hacer frente a los datos de series de tiempo y de panel.

Puede anticiparse a los problemas econométricos comunes debido a que ciertos fallos asunción CLRM son más probables con determinados tipos de datos. Dos casos típicos de fallos suposición CLRM implican heteroscedasticidad (que ocurre frecuentemente en modelos usando los datos de la sección transversal) y autocorrelación (que tiende a estar presente en modelos usando datos de series temporales).

Además de conocer el tipo de datos que se está trabajando, asegúrese de que siempre está consciente de la siguiente información:

El nivel de agregación utilizado en la medición de las variables: El nivel de agregación se refiere a la unidad de análisis cuando la información se adquiere para los datos. En otras palabras, las medidas variables pueden tener su origen en un nivel más bajo de agregación (como un individuo, hogar, o de una empresa) o en un nivel superior de agregación (como una ciudad, condado o estado).
los frecuencia con la que los datos se captura: La frecuencia se refiere a la velocidad a la que se obtienen mediciones. datos de series temporales pueden ser capturados en una frecuencia más alta (como horaria, diaria, o semanal) o a la frecuencia más baja (como mensualmente, trimestralmente o anualmente).

Todos los datos en el mundo no le permiten producir resultados convincentes si el nivel de agregación o la frecuencia no es apropiado para su problema. Por ejemplo, si usted está interesado en la determinación de cómo el gasto por alumno afecta el rendimiento académico, los datos a nivel estatal probablemente no sea apropiado porque el gasto y características de los alumnos tienen tanta variación entre ciudades dentro de los estados que sus resultados son susceptibles de inducir a error.

Video: Distribución chi-cuadrado

Evitar la trampa de minería de datos

A medida que adquiera más herramientas de análisis de datos, se vea obligado a buscar los datos para las relaciones entre variables. Usted puede utilizar su conocimiento de estadísticas para encontrar modelos que se ajustan a sus datos bastante bien. Sin embargo, esta práctica se conoce como minería de datos, y no desea ser seducido por ella!

Aunque la minería de datos puede ser útil en campos en los que el mecanismo subyacente a la generación de los resultados no es importante, la mayoría de los economistas no ven favorablemente este enfoque. En la econometría, la construcción de un modelo que tiene sentido y es reproducible por otros es mucho más importante que la búsqueda de un modelo que tiene un ajuste perfecto.

La incorporación de información cuantitativa y cualitativa

los resultados económicos pueden verse afectadas por factores tanto cuantitativos (numéricos) y cualitativos (no numéricos). En general, la información cuantitativa tiene una aplicación directa e interpretación en los modelos econométricos.

Las variables cualitativas se asocian con características que no tienen una representación numérica natural, aunque sus datos en bruto pueden codificar características cualitativas con un valor numérico. Por ejemplo, una región EE.UU. puede codificarse con un 1 para West, 2 para el sur, 3 para Medio Oeste, y 4 para el Noreste. Sin embargo, la asignación de los valores específicos es arbitraria y no lleva ningún significado especial.

A fin de utilizar la información contenida en las variables cualitativas, por lo general convertirlos en variables ficticias - variables dicotómicas que asumen un valor de 1 si una característica particular está presente y 0 en caso contrario.

A veces el propio resultado económico es cualitativa o contiene valores restringidos. Por ejemplo, la variable dependiente podría medir si o no una firma falla (quiebra) en un año determinado utilizando diversas características de las empresas como variables independientes. Aunque las técnicas estándar son a veces aceptables con variables dependientes cualitativas y no continuas, por lo general dan lugar a violaciónes asunción y requieren un enfoque econométrico alternativo.

Reconociendo la importancia del tipo de datos, la frecuencia y la agregación

Video: Teoría - Estadística Básica - Introducción - Series temporales

Video: Distribución chi-cuadrado

Evitar la trampa de minería de datos

La incorporación de información cuantitativa y cualitativa