Cómo configurar la función de regresión poblacional modelo (PRF)

Antes de comenzar con el análisis de regresión, es necesario identificar el regre poblaciónsfunción sión (PRF). El PRF define la realidad (o su percepción de ella) en su relación con su tema de interés. Para identificarlo, es necesario determinar las variables dependientes e independientes (y cómo van a ser medidos), así como la función matemática que describe cómo se relacionan las variables.

Después de reducir su tema o cuestión de interés, usted está listo para desarrollar su modelo usando los siguientes pasos:

  1. Proporcionar la especificación matemática general de su modelo.

    La especificación general denota la variable dependiente y todas las variables independientes (o explicativas) que usted cree que afecta a la variable dependiente en su población de interés.

    Supongamos que tres variables afectan la variable dependiente. La especificación general se verá algo como Y = F(X1,X2,X3), dónde Y es la variable dependiente y el Xs representan las variables independientes, que usted cree que directamente afecta (o causa) fluctuaciones en el Y variable.

    A menos que el razonamiento es obvio, proporcionar una cierta justificación de las variables elegidas como variables independientes y por la forma funcional de la especificación (ver paso 2). Si lo hace, le ayuda a evitar errores de especificación, que se produce si se omite variables importantes o incluir variables irrelevantes.

  2. Deducir la especificación econométrica de su modelo.

    En este paso, usted toma las variables identificadas en el paso 1 y desarrollar una función que puede ser utilizado para calcular los resultados econométricos. Esta forma funcional se conoce como el Poblaciónlación regresfunción sión (PRF). En este paso, usted también está reconociendo que la relación que planteó la hipótesis en el paso 1 se espera que de existir cuando nos fijamos en la media de los de datos no para cada observación individual.

    Suponga que tiene razones para creer que el modelo es lineal. Se parece a esto:

    imagen0.jpg

    En esta función, el operador de media condicional E(Y|X1,X2,X3) Indica que se espera que la relación de sostener, en promedio, para valores dados de las variables independientes. El término de intersección

    image1.jpg

    también llamado constante, es el valor medio esperado de Y cuando todo Xs son iguales a cero. Las otras betas representan las pistas parciales (efectos). Estas pendientes parciales le dicen la cantidad de sus cambios de variables dependientes cuando cambia la variable independiente en una unidad, pero mantiene el valor de las otras variables independientes constantes.

    (Esta idea de cambiar una cosa y manteniendo el resto de la misma es la ceteris paribus, o todo lo demás igual, a condición de que usted está familiarizado con tus cursos de introducción a la economía.)

    Dependiendo del fenómeno particular que está analizando, una relación no lineal utilizando cuadrado términos, registros, u otro método en lugar de la función lineal

    image2.jpg

    puede ser más apropiado.

    La especificación de su elección se asume para describir la " true " relación, así que asegúrese de justificar el uso de la teoría económica de sonido y el sentido común.

  3. Especifique la naturaleza aleatoria de su modelo.

    Este paso aclara que la relación que hemos asumido en los pasos 1 y 2 tiene, en promedio, pero puede contener errores cuando se elige una observación específica al azar de la población. Esto se conoce como la función de regresión población estocástico y se escribe como

    image3.jpg

    donde el yo subíndices denotan ninguna observación elegido al azar y

    image4.jpg

    representa el estocástico (o aleatorio) término de error asociado con esa observación. Tenga en cuenta que stochastic es simplemente la jerga de las estadísticas aleatorio.

    Independientemente de lo que usted elija para representar a la PRF, el término de error aleatorio representa la diferencia entre el valor observado de la variable dependiente y la media condicional de la variable dependiente derivado de su modelo. Este valor es positivo si el valor observado está por encima de la media condicional y negativa si está por debajo.

El error aleatorio puede resultar de uno o más de los siguientes factores:

  • Datos insuficientes o medidos de forma incorrecta

  • La falta de conocimientos teóricos para explicar completamente todos los factores que afectan a la variable dependiente

  • La aplicación de un encofrado funcional incorrecta por ejemplo, suponiendo que la relación es lineal cuando es cuadrática

  • Características no observables

  • Elementos impredecibles de conducta

Si usted tiene varias variables explicativas, se puede ahorrar tiempo escribiendo el modelo econométrico utilizando algún taquigrafía matemática. Con la notación algebraica, se vería como una de las dos funciones siguientes:

image5.jpg


» » » » Cómo configurar la función de regresión poblacional modelo (PRF)