La aplicación de los métodos estadísticos a los problemas económicos

Estudiantes Econometría siempre aprecian una revisión de los conceptos estadísticos que son más importantes para tener éxito con la econometría. En concreto, debe ser cómodo con distribuciones de probabilidad, el cálculo de la estadística descriptiva y pruebas de hipótesis.

Su capacidad de cuantificar con precisión las relaciones económicas no sólo depende de sus habilidades de construcción de modelos econométricos, sino también en la calidad de los datos que está utilizando para su análisis y su capacidad para adoptar las estrategias adecuadas para la estimación de modelos que puedan violar una hipótesis estadística . Los datos deben ser derivados de un proceso de recolección confiable, pero debe también ser conscientes de las limitaciones o retos adicionales.

Ellos pueden incluir, pero no se limitan a

  • La agregación de los datos: Información que puede tener su origen en un hogar, individuo o nivel de las empresas se está midiendo a una ciudad, condado, estado o nivel de los países en sus datos.

  • Estadísticamente correlacionados pero económicamente irrelevantes variables: Algunos conjuntos de datos contiene una gran cantidad de información, pero muchas de las variables pueden tener nada que ver con la cuestión económica que usted está esperando para abordar.

  • Datos cualitativos: Conjuntos de datos ricos suelen incluir variables cualitativas (información geográfica, raza, etc.), pero esta información requiere de un tratamiento especial antes de poder utilizarlo en un modelo econométrico.

  • Clásica modelo de regresión lineal (CLRM) incumplimiento supuesto: La legitimidad de su enfoque econométrico siempre se basa en un conjunto de supuestos estadísticos, pero usted es probable encontrar que al menos una de estas hipótesis no se sostiene (lo que significa que no es cierto para los datos).

Los econometristas diferenciarse de los estadísticos, haciendo hincapié en violaciónes de los supuestos estadísticos que a menudo se dan por sentado. La técnica más común para la estimación de un modelo econométrico es de mínimos cuadrados ordinarios (MCO). Sin embargo, una serie de supuestos CLRM debe mantener para que la técnica de OLS para proporcionar estimaciones confiables. En la práctica, los supuestos que son más propensos a fallar dependen de sus datos y la aplicación específica.

Reconociendo la importancia del tipo de datos, la frecuencia y la agregación

Los datos que se utiliza para estimar y probar el modelo econométrico se suelen clasificar en uno de los tres tipos posibles:

  • Sección transversal: Este tipo de datos se compone de mediciones para las observaciones individuales (personas, hogares, empresas, condados, estados, países, o lo que sea) en un punto dado en el tiempo.

  • Series de tiempo: Este tipo de datos se compone de mediciones en una o más variables (como el producto interno bruto, tasas de interés o tasas de desempleo) con el tiempo en un espacio determinado (como un determinado país o estado).

  • Panel o longitudinal: Este tipo de datos se compone de una serie de tiempo para cada unidad de la sección transversal en la muestra. Los datos contienen medidas para las observaciones individuales (personas, hogares, empresas, condados, estados, países, etc.) durante un período de tiempo (días, meses, trimestres o años).

El tipo de datos que está utilizando puede influir en cómo estimar su modelo econométrico. En particular, se requieren por lo general técnicas especializadas para tratar con datos de series temporales y de panel.

Puede anticipar problemas econométricos comunes debido a que ciertos fracasos asunción CLRM son más propensos a determinados tipos de datos. Dos casos típicos de fallas asunción CLRM implican heterocedasticidad (lo que ocurre con frecuencia en los modelos a partir de datos de la sección transversal) y autocorrelación (que tiende a estar presente en los modelos a partir de datos de series de tiempo).

Además de conocer el tipo de datos que está trabajando, asegúrese de que está siempre al tanto de la información siguiente:

  • El nivel de agregación utilizado en la medición de las variables: El nivel de agregación se refiere a la unidad de análisis cuando la información se adquiere para los datos. En otras palabras, las mediciones de variables pueden tener su origen en un nivel inferior de agregación (como un individuo, familia o empresa) o en un nivel superior de agregación (como una ciudad, condado o estado).

  • los frecuencia con el que se capturan los datos: La frecuencia se refiere a la velocidad a la que se obtienen mediciones. Series cronológicas de datos pueden ser capturados en una frecuencia más alta (como hora, diario, o semanal) o en menor frecuencia (como mensual, trimestral o anual).

Todos los datos en el mundo no le permiten producir resultados convincentes si el nivel de agregación o la frecuencia no es apropiada para su problema. Por ejemplo, si usted está interesado en la determinación de cómo el gasto por alumno afecta el rendimiento académico, los datos a nivel estatal es probable que no sea apropiado porque el gasto y las características de los alumnos tienen tanta variación entre ciudades dentro de los estados que sus resultados puedan ser engañosas.

Evitar la trampa de minería de datos

A medida que adquiera más herramientas de análisis de datos, puede estar inclinado a buscar los datos para las relaciones entre las variables. Usted puede utilizar su conocimiento de las estadísticas para encontrar modelos que se ajustan a los datos bastante bien. Sin embargo, esta práctica se conoce como minería de datos, y usted no quiere dejarse seducir por ella!

Aunque la minería de datos puede ser útil en campos en los que el mecanismo subyacente a la generación de los resultados no es importante, la mayoría de los economistas no ven este enfoque favorablemente. En la econometría, la construcción de un modelo que tiene sentido y es reproducible por otros es mucho más importante que la búsqueda de un modelo que tiene un ajuste perfecto.

La incorporación de información cuantitativa y cualitativa

Resultados económicos pueden verse afectados por factores tanto cuantitativos (numéricos) y cualitativos (no numéricos). En general, la información cuantitativa tiene una aplicación directa e interpretación en los modelos econométricos.

Las variables cualitativas se asocian con características que no tienen una representación numérica natural, aunque los datos crudos pueden codificar características cualitativas con un valor numérico. Por ejemplo, una región de Estados Unidos puede ser codificado con un 1 para West, 2 para el sur, 3 para Medio Oeste, y 4 para el noreste. Sin embargo, la asignación de los valores específicos es arbitraria y no lleva ningún significado especial.

A fin de utilizar la información contenida en las variables cualitativas, por lo general les va a convertir en variables ficticias - variables dicotómicas que toman un valor de 1 si una característica particular está presente y 0 en caso contrario.

A veces el propio resultado económico es cualitativa o contiene valores restringidos. Por ejemplo, la variable dependiente podría medir si una empresa de falla (quiebra) en un año determinado utilizando diversas características de las empresas como variables independientes. Aunque las técnicas estándar a veces son aceptables con variables dependientes cualitativas y no continuas, por lo general resultan en violaciónes de asunción y requieren un enfoque econométrico alternativo.




» » » » La aplicación de los métodos estadísticos a los problemas económicos