Letteratura sulla regressione quantile IV


16

Negli ultimi mesi ho letto intensamente della regressione quantile in preparazione della mia tesi di laurea di questa estate. In particolare ho letto la maggior parte del libro di Roger Koenker del 2005 sull'argomento. Ora voglio espandere questa conoscenza esistente alle tecniche di regressione quantile che consentono variabili strumentali (IV). Questo sembra essere un campo di ricerca attivo che sta crescendo rapidamente.

Qualcuno può forse suggerirmi:

  • documenti o altra letteratura sulla regressione quantile IV
  • una breve panoramica di queste diverse tecniche statistiche
  • i pro e i contro di diverse tecniche

Sto cercando principalmente letteratura per farmi iniziare e avere una buona panoramica di ciò che è là fuori. Quindi il primo punto è quello importante. Il secondo e il terzo sarebbe bello avere! Inoltre, il mio interesse risiede principalmente nei metodi trasversali, ma anche i metodi panel sono i benvenuti.

Grazie in anticipo.

Risposte:



24

Anche se questa domanda ha già una risposta accettata, penso di poter ancora contribuire a questo. Il libro Koenker (2005) non ti porterà davvero lontano perché gli sviluppi nella IV regressione quantile hanno iniziato a riprendersi da quel momento.

Le prime tecniche di regressione quantile IV includono la struttura della catena causale di Chesher (2003) , che è stata ulteriormente sviluppata nell'approccio ponderato delle deviazioni medie (WAD) di Ma e Koenker (2006) . In questo articolo introducono anche l'approccio delle variabili di controllo. Un'idea simile è stata usata da Lee (2007) che ha derivato uno stimatore della regressione quantile IV usando le funzioni di controllo.
Tutti questi stimatori fanno uso di una presunta struttura di errore triangolare necessaria per l'identificazione. Il problema è che questa struttura triangolare non è plausibile per problemi di endogeneità che sorgono a causa della simultaneità. Ad esempio, non è possibile utilizzare questi stimatori per un problema di stima della domanda e dell'offerta.

Lo stimatore di Abadie, Angrist e Imbens (2002), menzionato da Dimitriy V. Masterov, presuppone che tu abbia sia una variabile endogena binaria che uno strumento binario. In generale, si tratta di un framework molto restrittivo, ma estende l'approccio LATE dalla regressione lineare IV alle regressioni quantili. Questo è carino perché molti ricercatori, specialmente in economia, hanno familiarità con il concetto LATE e l'interpretazione dei coefficienti risultanti.

Il seminario di Chernozhukov e Hansen (2005) ha dato il via a questa letteratura e questi due ragazzi hanno lavorato molto in questo settore. Lo stimatore di regressione quantile IV (IVQR) fornisce un collegamento naturale allo stimatore 2SLS nel contesto quantile. Il loro stimatore è implementato tramite Matlab o Ox, come ha sottolineato Dimitriy, ma puoi dimenticare quel documento di Kwak (2010). Questo documento non è mai stato pubblicato sul giornale Stata e anche il suo codice non viene eseguito correttamente. Presumo abbia abbandonato questo progetto.
Dovresti invece considerare lo stimatore di equazioni di stima livellate IVQR (SEE-IVQR) di Kaplan e Sun (2012). Questo è uno stimatore recente che è un miglioramento rispetto allo stimatore IVQR originale in termini di velocità computazionale (evita il pesante algoritmo di ricerca della griglia) e errore quadratico medio. Il codice Matlab è disponibile qui .

L'articolo di Frölich e Melly (2010) è carino perché considera la differenza tra regressione quantistica condizionale e incondizionata. Il problema con la regressione quantile in generale è che una volta incluse le covariate nella regressione, l'interpretazione cambia. In OLS puoi sempre passare dall'aspettativa condizionale a quella incondizionata attraverso la legge delle aspettative iterate, ma per i quantili questo non è disponibile. Questo problema è stato mostrato per la prima volta da Firpo (2007) e Firpo et al. (2009). Usa una funzione di influenza ricentrata per emarginare i coefficienti di regressione quantile condizionale in modo tale che possano essere interpretati come i soliti coefficienti OLS. Per il tuo scopo, questo stimatore non aiuterà molto perché consente solo variabili esogene. Se sei interessato, Nicole Fortin rende disponibile il codice Stata sul suo sito web.

Il più recente stimatore incondizionato della regressione quantistica IV che conosco è di Powell (2013) . Il suo stimatore di regressione quantistica generalizzato (IV) consente di stimare gli effetti marginali del trattamento quantile in presenza di endogeneità. Da qualche parte sul sito web RAND rende disponibile anche il suo codice Stata, ma non sono riuscito a trovarlo proprio ora. Da quando lo hai chiesto: in un precedente documento aveva implementato questo stimatore nel contesto dei dati del panel (vedi Powell, 2012 ). Questo stimatore è eccezionale perché, a differenza di tutti i precedenti metodi QR di dati panel, questo stimatore non si basa su grandi asintotici T (che di solito non si hanno, almeno non nei dati microeconometrici).

Ultimo ma non meno importante, una variante più esotica: lo stimatore IVQR censurato (CQIV) di Chernozhukov et al. (2011) consente di occuparsi dei dati censurati, come suggerisce il nome. È un'estensione del documento di Chernozhukov e Hong (2003) che non collego perché non è per il IV contesto. Questo strumento di calcolo è pesante dal punto di vista computazionale, ma se hai dati censurati e nessun altro modo per aggirarli, questa è la strada da percorrere. Amanda Kowalski ha pubblicato il codice Stata sul suo sito Web oppure è possibile scaricarlo da RePEc. Questo stimatore (e, tra l'altro, anche IVQR e SEE-IVQR) presume che tu abbia una variabile endogena continua. Ho usato questi stimatori nel contesto delle regressioni degli utili in cui l'educazione era la mia variabile endogena che prendeva tra 18 e 20 valori, quindi non esattamente continua. Ma negli esercizi di simulazione ho sempre potuto dimostrare che questo non è un problema. Tuttavia, questo dipende probabilmente dall'applicazione, quindi se decidi di utilizzarlo, ricontrolla.


Questa è una risposta fantastica!
Dimitriy V. Masterov,

2
Aggiornamento breve e molto egocentrico: il già citato Kaplan and Sun (2012) è stato pubblicato nel 2017; i collegamenti alle versioni pubblicate e accettate (accesso aperto) insieme ai collegamenti a MATLAB e al codice R sono disponibili su faculty.missouri.edu/~kaplandm Altri documenti / codici più generali (che consentono serie temporali e dati del panel) saranno presto disponibili (disponibili via e-mail per ora) ... in realtà, ho trovato la recensione molto utile sopra mentre rivedevo l'introduzione.
David M Kaplan,

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.