Coerenza di 2SLS con variabile binaria endogena


10

Ho letto che lo stimatore 2SLS è ancora coerente anche con la variabile endogena binaria ( http://www.stata.com/statalist/archive/2004-07/msg00699.html ). Nella prima fase, verrà eseguito un modello di trattamento probit anziché un modello lineare.

Esistono prove formali per dimostrare che 2SLS è ancora coerente anche quando il 1 ° stadio è un modello probit o logit?

E se anche il risultato fosse anche binario? Capisco se abbiamo un risultato binario e una variabile endogena binaria (il 1o e il 2o stadio sono entrambi modelli binari probit / logit), l'imitazione del metodo 2SLS produrrà una stima incoerente. C'è qualche prova formale per questo? Il libro econometrico di Wooldridge ha alcune discussioni, ma penso che non ci siano prove rigorose per dimostrare l'incoerenza.

data sim;
     do i=1 to 500000;
        iv=rand("normal",0,1);
             x2=rand("normal",0,1);
        x3=rand("normal",0,1);
        lp=0.5+0.8*iv+0.5*x2-0.2*x3;
        T=rand("bernoulli",exp(lp)/(1+exp(lp)));
        Y=-0.8+1.2*T-1.3*x2-0.8*x3+rand("normal",0,1);
        output;
     end;
     run;

****1st stage: logit model ****;
****get predicted values   ****;         
proc logistic data=sim descending;
     model T=IV;
     output out=pred1 pred=p;
     run;

****2nd stage: ols model with predicted values****;
proc reg data=pred1;
     model y=p;
     run;

il coefficiente di p = 1.19984. Eseguo solo una simulazione ma con un campione di grandi dimensioni.


Non è necessario aggiungere link = probit all'istruzione modello?
Mike Hunter,

Risposte:


10

C'è stata una domanda simile per quanto riguarda un primo stadio probit e un secondo stadio OLS. Nella risposta ho fornito un link ad note che contengono una prova formale dell'incongruenza di questa regressione, che è formalmente conosciuta come "regressione proibita", come è stata definita da Jerry Hausman. Il motivo principale dell'incoerenza dell'approccio probit primo stadio / OLS secondo stadio è che né l'operatore delle aspettative né l'operatore delle proiezioni lineari passano attraverso un primo stadio non lineare. Pertanto, i valori adattati da un proverbio del primo stadio non sono correlati con il termine di errore del secondo stadio sotto ipotesi molto restrittive che quasi mai valgono in pratica. Siate consapevoli, tuttavia, che la prova formale dell'incoerenza della regressione proibita è abbastanza elaborata, se ricordo bene.

Yio=α+βXio+εio
YioXio
Xio=un'+Zio'π+ηio
X^ioXioXio


Yio

Per una discussione più dettagliata di ciò, dai un'occhiata agli eccellenti appunti di Kit Baum su questo argomento. Dalla diapositiva 7 discute l'uso del modello di probabilità lineare nel contesto 2SLS.

Infine, se vuoi davvero usare probit perché desideri stime più efficienti, c'è un altro modo che è anche menzionato in Wooldridge (2010) "Analisi econometrica di dati trasversali e panel". La risposta sopra collegata lo include, lo ripeto qui per completezza. Come esempio applicato, vedere Adams et al. (2009) che utilizzano una procedura in tre passaggi che procede come segue:

  1. usa probit per regredire la variabile endogena sullo strumento (i) e le variabili esogene
  2. utilizzare i valori previsti dal passaggio precedente in un primo stadio OLS insieme alle variabili esogene (ma senza strumentale)
  3. fare il secondo stadio come al solito

Questa procedura non rientra nel problema della regressione proibita, ma fornisce potenzialmente stime più efficienti dei parametri di interesse.


Ciao Andy, grazie per la tua risposta. Stai suggerendo "incoerenza del primo approccio probit / approccio secondo stadio OLS"? Non è quello che ho letto nel link che ho dato. Si dice che l'approccio Probit primo stadio / OLS secondo stadio sia coerente.
Vincent,

Non è quello che dice il post dello statalista. Se dai un'occhiata alla sezione "metodi e formula" per il comando treatreg (che ora si chiama etregress) nella documentazione , vedrai che lo stimatore a 2 passaggi non è 2SLS con un primo stadio probit / secondo stadio OLS. Invece, probit viene prima utilizzato per ottenere i rapporti di rischio che vengono quindi utilizzati in una regressione OLS per ottenere stime coerenti.
Andy,

Grazie Andy. Sta diventando interessante. Sembra che imitare 2SLS con il modello probit nel 1 ° stadio non venga accettato. Leggerò "la proibizione della regressione" per ragioni teoriche. A proposito, ho provato una simulazione usando SAS e i risultati non sembrano male per 2SLS con probit 1st / ols 2nd.
Vincent,

Sto pubblicando il codice nella domanda principale e mi piacerebbe sentire i tuoi commenti. Grazie!
Vincent,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.