Ho letto che lo stimatore 2SLS è ancora coerente anche con la variabile endogena binaria ( http://www.stata.com/statalist/archive/2004-07/msg00699.html ). Nella prima fase, verrà eseguito un modello di trattamento probit anziché un modello lineare.
Esistono prove formali per dimostrare che 2SLS è ancora coerente anche quando il 1 ° stadio è un modello probit o logit?
E se anche il risultato fosse anche binario? Capisco se abbiamo un risultato binario e una variabile endogena binaria (il 1o e il 2o stadio sono entrambi modelli binari probit / logit), l'imitazione del metodo 2SLS produrrà una stima incoerente. C'è qualche prova formale per questo? Il libro econometrico di Wooldridge ha alcune discussioni, ma penso che non ci siano prove rigorose per dimostrare l'incoerenza.
data sim;
do i=1 to 500000;
iv=rand("normal",0,1);
x2=rand("normal",0,1);
x3=rand("normal",0,1);
lp=0.5+0.8*iv+0.5*x2-0.2*x3;
T=rand("bernoulli",exp(lp)/(1+exp(lp)));
Y=-0.8+1.2*T-1.3*x2-0.8*x3+rand("normal",0,1);
output;
end;
run;
****1st stage: logit model ****;
****get predicted values ****;
proc logistic data=sim descending;
model T=IV;
output out=pred1 pred=p;
run;
****2nd stage: ols model with predicted values****;
proc reg data=pred1;
model y=p;
run;
il coefficiente di p = 1.19984
. Eseguo solo una simulazione ma con un campione di grandi dimensioni.