La 2SLS Just-Identified è mediana non distorta?


13

In Mostly Harmless Econometrics: An Empiricist's Companion (Angrist and Pischke, 2009: pagina 209) Ho letto quanto segue:

(...) In effetti, 2SLS appena identificato (diciamo, il semplice stimatore Wald) è approssimativamente imparziale . Questo è difficile da mostrare formalmente perché la 2SLS appena identificata non ha momenti (cioè, la distribuzione del campionamento ha code grasse). Tuttavia, anche con strumenti deboli, la 2SLS appena identificata è approssimativamente centrata dove dovrebbe essere. Pertanto diciamo che la 2SLS appena identificata è imparziale mediana. (...)

Sebbene gli autori affermino che la 2SLS appena identificata è imparziale mediana, non la dimostrano né forniscono un riferimento a una prova . A pagina 213 citano di nuovo la proposta, ma senza alcun riferimento a una prova. Inoltre, non riesco a trovare alcuna motivazione per la proposta nelle loro note di lezione sulle variabili strumentali del MIT , pagina 22.

Il motivo potrebbe essere che la proposta è falsa poiché la respingono in una nota sul loro blog . Tuttavia, 2SLS appena identificato è approssimativamente mediano-imparziale, scrivono. Lo motivano usando un piccolo esperimento di Monte-Carlo, ma non forniscono alcuna prova analitica o espressione in forma chiusa del termine di errore associato all'approssimazione. Comunque, questa è stata la risposta degli autori al professore Gary Solon della Michigan State University che ha fatto il commento che la 2SLS appena identificata non è mediana-imparziale.

Domanda 1: Come dimostrate che la 2SLS appena identificata non è mediana e non imparziale come sostiene Gary Solon?

Domanda 2: Come dimostrate che la 2SLS appena identificata è approssimativamente mediana-imparziale come sostengono Angrist e Pischke?

Per la domanda 1 Sto cercando un controesempio. Per la domanda 2, cerco (principalmente) una prova o un riferimento a una prova.

Sto anche cercando una definizione formale di mediana-imparziale in questo contesto. Comprendo il concetto come segue: uno stimatore di basato su un insieme di variabili casuali è mediano-imparziale per se e solo se la distribuzione di ha una mediana .θX1:nnθ θ (X1:n)θθ^(X1:n)θX1:nnθθ^(X1:n)θ


Appunti

  1. In un modello appena identificato il numero di regressori endogeni è uguale al numero di strumenti.

  2. Il framework che descrive un modello di variabili strumentali appena identificato può essere espresso come segue: Il modello causale di interesse e l'equazione del primo stadio è dove è una matrice che descrive regressori endogeni e dove le variabili strumentali sono descritte da una matrice . Qui descrive solo un numero di variabili di controllo (ad esempio, aggiunte per migliorare la precisione); e e sono termini di errore. Xk×n+1kk×n+1ZWuv

    (1){Y=Xβ+Wγ+uX=Zδ+Wζ+v
    Xk×n+1kk×n+1ZWuv
  3. Stimiamo in usando 2SLS: in primo luogo, regredisci su controllando per e acquisendo i valori previsti ; questo è chiamato il primo stadio. In secondo luogo, regredisci su controllando per ; questo è chiamato il secondo stadio. Il coefficiente stimato su nella seconda fase è la nostra stima 2SLS di .( 1 ) X Z W X Y X W X ββ(1)XZWX^YX^WX^β

  4. Nel caso più semplice abbiamo il modello e lo strumento il regressore endogeno con . In questo caso, la stima 2SLS di è dove indica la covarianza campione tra e . Possiamo semplificare : dove , ex i z i β β 2SLS = s Z Y

    yi=α+βxi+ui
    xiziβsABAB(2) β 2SLS=Σi(yi- ˉ y )zi
    (2)β^2SLS=sZYsZX,
    sABAB(2) ˉy=iyi/nˉx=ixi/nˉu=iui/nn
    (3)β^2SLS=i(yiy¯)zii(xix¯)zi=β+i(uiu¯)zii(xix¯)zi
    y¯=iyi/nx¯=ixi/nu¯=iui/n, dove è il numero di osservazioni.n
  5. Ho fatto una ricerca in letteratura usando le parole "appena identificato" e "mediano-imparziale" per trovare riferimenti che rispondessero alle domande 1 e 2 (vedi sopra). Non ne ho trovato nessuno. Tutti gli articoli che ho trovato (vedi sotto) fanno riferimento ad Angrist e Pischke (2009: pagina 209, 213) quando affermano che la 2SLS appena identificata è mediana-imparziale.

    • Jakiela, P., Miguel, E., & Te Velde, VL (2015). Te lo sei guadagnato: stimare l'impatto del capitale umano sulle preferenze sociali. Experimental Economics , 18 (3), 385-407.
    • An, W. (2015). Stime delle variabili strumentali degli effetti dei pari nei social network. Ricerca in scienze sociali , 50, 382-394.
    • Vermeulen, W., e Van Ommeren, J. (2009). La pianificazione dell'uso del suolo modella le economie regionali? Un'analisi simultanea dell'offerta abitativa, della migrazione interna e della crescita dell'occupazione locale nei Paesi Bassi. Journal of Housing Economics , 18 (4), 294-310.
    • Aidt, TS e Leon, G. (2016). La finestra democratica delle opportunità: prove delle rivolte nell'Africa subsahariana. Journal of Conflict Resolution , 60 (4), 694-717.

2
Non ho potuto rispondere con una prova formale, ma piuttosto con alcuni studi di simulazione che mostrano che LIML è mediana imparziale (più definizione) e che LIML e 2SLS con una variabile endogena e uno strumento hanno la stessa piccola distribuzione del campione (quindi se LIML in questo il caso è mediano-imparziale, quindi lo è anche 2SLS). Sarebbe sufficiente per rispondere alla tua domanda?
Andy,

@Andy Sarebbe davvero una buona risposta! Forse sufficiente, a seconda di ciò che altri utenti potrebbero dire. Probabilmente è sufficiente poiché ritengo che non vi siano prove della proposizione che la 2SLS appena identificata sia approssimativamente mediana-imparziale. Sarebbe bello con un controesempio che mostra che 2SLS appena identificato non è tuttavia mediano-imparziale; ma penso che sia possibile (ma forse difficile) inventarmi un controesempio.
Elias

Con approssimativamente imparziale, vuoi dire che il bias va a zero come una funzione del numero di osservazioni, come 1 / n o 1 / n ^ 2, ecc.?
Igor

@Igor La frase "approssimativamente mediana-imparziale" non è usata da me. Dal momento che non so cosa significhi formalmente "imparziale mediana", non posso rispondere alla tua domanda. Ma quello che sembra pensare è che uno stimatore sia asintoticamente imparziale.
Elias

Risposte:


6

Negli studi di simulazione il termine bias mediano si riferisce al valore assoluto delle deviazioni di uno stimatore dal suo valore reale (che in questo caso si conosce perché è una simulazione, quindi si sceglie il valore reale). Puoi vedere un documento di lavoro di Young (2017) che definisce il bias mediano come questo nella tabella 15, o Andrews and Armstrong (2016) che tracciano grafici di bias mediani per diversi stimatori nella figura 2.

Parte della confusione (anche in letteratura) sembra derivare dal fatto che ci sono due problemi sottostanti separati:

  1. strumenti deboli
  2. molti strumenti (potenzialmente) deboli

Il problema di avere uno strumento debole in un ambiente appena identificato è molto diverso dall'avere molti strumenti in cui alcuni sono deboli, tuttavia a volte i due problemi vengono messi insieme.

Prima di tutto, consideriamo la relazione tra gli stimatori di cui stiamo parlando qui. Theil (1953) in "Stima e correlazione simultanea nei sistemi di equazione completi" ha introdotto il cosiddetto stimatore -klass: ß = [ X ' ( I - κ M Z ) X ] - 1 [ X ' ( I - κ M Z ) y ) ]κ

β^=[X(IκMZ)X]1[X(IκMZ)y)]

con , per il sistema di equazioni yMZ=IZ(ZZ)1Z

y=Xβ+uX=Zπ+e.

Lo scalare determina quale stimatore abbiamo. Per torni a OLS, per hai lo stimatore 2SLS e quando è impostato sulla radice più piccola di tu avere lo stimatore LIML (vedi Stock e Yogo, 2005 , p. 111)κκ=0κ=1κdet(XXκXMZX))=0

Asintoticamente, LIML e 2SLS hanno la stessa distribuzione, tuttavia in piccoli campioni questo può essere molto diverso. Questo è particolarmente vero quando abbiamo molti strumenti e se alcuni sono deboli. In questo caso, LIML funziona meglio di 2SLS. LIML qui ha dimostrato di essere mediano imparziale. Questo risultato deriva da una serie di studi di simulazione. Di solito i documenti che affermano questo risultato si riferiscono a Rothberg (1983) "Proprietà asintotiche di alcuni stimatori in modelli strutturali", Sawa (1972) o Anderson et al. (1982) .

Steve Pischke fornisce una simulazione per questo risultato nelle sue note del 2016 sulla diapositiva 17, mostrando la distribuzione di OLS, LIML e 2SLS con 20 strumenti di cui solo uno è effettivamente utile. Il valore del coefficiente reale è 1. Si vede che LIML è centrato sul valore reale mentre 2SLS è distorto verso OLS. inserisci qui la descrizione dell'immagine

Ora l'argomento sembra essere il seguente: dato che LIML può essere mostrato come mediano imparziale e che nel caso appena identificato (una variabile endogena, uno strumento) LIML e 2SLS sono equivalenti, anche 2SLS deve essere mediana imparziale.

Tuttavia, sembra che le persone stiano mescolando nuovamente il caso "strumento debole" e il caso "molti strumenti deboli" perché nell'impostazione appena identificata sia LIML che 2SLS saranno distorti quando lo strumento è debole. Non ho visto alcun risultato in cui è stato dimostrato che LIML è imparziale nel caso appena identificato quando lo strumento è debole e non penso che sia vero. Una conclusione simile emerge dalla risposta di Angrist e Pischke (2009) a Gary Solo a pagina 2, dove simulano la propensione di OLS, 2SLS e LIML quando cambiano la forza dello strumento. inserisci qui la descrizione dell'immagine

Per coefficienti del primo stadio molto piccoli <0,1 (tenendo fisso l'errore standard), ovvero bassa resistenza dello strumento, 2SLS appena identificato (e quindi LIML appena identificato) è molto più vicino al limite di probabilità dello stimatore OLS rispetto al valore del coefficiente reale di 1.

Una volta che il coefficiente del primo stadio è compreso tra 0,1 e 0,2, notano che la statistica del primo stadio F è superiore a 10 e quindi non vi è più alcun problema di strumento debole secondo la regola empirica di F> 10 di Stock e Yogo (2005). In questo senso, non riesco a vedere come il LIML dovrebbe essere una soluzione per un problema di strumento debole nel caso appena identificato. Si noti inoltre che i) LIML tende ad essere più disperso e richiede una correzione dei suoi errori standard (vedi Bekker, 1994) e ii) se il tuo strumento è effettivamente debole, non troverai nulla nel secondo stadio né con 2SLS né LIML perché gli errori standard saranno troppo grandi.


Grazie per la risposta! Questo mi ha reso tutto molto più chiaro.
Elias,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.