Especificación de funciones no lineales apropiadas: los modelos probit y logit
Si el resultado de interés es cualitativa, se utiliza una variable dependiente maniquí y estimar la probabilidad de que el resultado (Y
Conteúdo
El problema más obvio con la estimación de un modelo de variable dependiente simulado utilizando OLS es que las probabilidades predichas no están garantizados para estar dentro del intervalo [0,1]. OLS no se puede modificar para hacer frente a este problema completamente debido a la no linealidad en los parámetros se requiere con el fin de garantizar que todas las probabilidades predichas tienen valores razonables. En consecuencia, se debe utilizar una especificación alternativa. Los econometristas elijan el probit o la función logit.
Con una función probit o logit, las probabilidades condicionales están linealmente relacionadas con la variable independiente (s). Además, ambas funciones tienen la característica de acercarse a 0 y 1 gradualmente (asintóticamente), por lo que las probabilidades predichas son siempre sensible.
La figura ilustra las probabilidades condicionales de un OLS (también conocido como el modelo de probabilidad lineal LPM), una probit, y un modelo logit.
Trabajando desde el CDF normal estándar: El modelo probit
El modelo probit se basa en la función normal estándar de densidad acumulativa (CDF), que se define como
dónde Z es una variable normal estandarizada y e es la base del logaritmo natural (el valor 2,71828...).
En un modelo probit, la norma FDA normal reemplaza la función lineal, por lo que usted estima
Los términos beta no se pueden estimar por MCO, por lo que es necesario utilizar una técnica conocida como máxima verosimilitud (ML).
Para cualquier dada X, el modelo probit proporciona la Z valor para la observación. El PDF normal estándar o CDF se pueden utilizar para obtener la probabilidad de que Y = 1 para que la observación.
La siguiente figura muestra cómo hacer para encontrar la probabilidad de que cualquier observación dado.
Después de estimar un modelo probit, la mayoría del software econométrico puede calcular las probabilidades predichas para todas las observaciones de la muestra.
Basando fuera de la logística de la FCD: El modelo logit
El modelo logit se basa en la función de densidad acumulativa logística (CDF), define como
dónde G es una variable aleatoria y logística e es la base del logaritmo natural (el valor 2,71828...).
La distribución logística puede ser desconocido para usted, pero es similar a una normal estándar. Sin embargo, tiene menor densidad dentro de una desviación estándar de la media de una distribución normal estándar. La siguiente figura ilustra la diferencia entre el nivel normal y la distribución logística.
En un modelo logit, la logística CDF reemplaza la función lineal de modo que usted estima
Nota: No se puede utilizar MCO para estimar la betas- lugar, usted tiene que utilizar la técnica de máxima verosimilitud (ML).
Para cualquier dada X, el modelo logit proporciona el valor de la observación de que se puede utilizar con la CDF logística para encontrar la probabilidad de que Y = 1 para que la observación.
La siguiente figura ilustra la forma en que encuentre la probabilidad de que cualquier observación dado.
Cuando usted tiene su modelo logit estimado, puede utilizar el software econométrico como STATA para calcular las probabilidades predichas para todas sus observaciones muestrales.