Il "sandwich" in questione è due pezzi di pane definiti dalle informazioni attese che racchiudono una carne definita dalle informazioni osservate. Vedi i miei commenti qui e qui . Per una regressione lineare, l'equazione di stima è:
U( β) = XT( Y- XTβ)
Le informazioni previste (pane) sono:
A = ∂U( β)∂β= - ( XTX )
Le informazioni osservate (carne) sono:
B = E( U( β) U( β)T) = XT( Y- XTβ) ( Y- XTβ)TX
Si noti che il termine interno è una diagonale di residui costanti quando si incontra l'omoscedasticità, assunzione di dati indipendenti, quindi lo stimatore di covarianza sandwich che è dato da è la solita matrice di covarianza di regressione lineare dove è la varianza dei residui. Tuttavia, è piuttosto severo. Ottieni una classe di stimatori considerevolmente più ampia rilassando le ipotesi coinvolte attorno alla matrice residua : . σ 2 ( X T X ) - 1 σ 2 n × n R = ( Y - X T β ) ( Y - X T β )UN- 1B A- 1σ2( XTX )- 1σ2n × n
R=(Y−XTβ)(Y−XTβ)
Lo vcovHC
stimatore "HC0" è coerente anche quando i dati non sono indipendenti. Quindi non dirò che "assumiamo" che i residui siano indipendenti, ma dirò che utilizziamo "una struttura di covarianza indipendente funzionante". Quindi la matrice è sostituita da una diagonale dei residuiR
Rii=(Yi−βXI.)2,0 elsewhere
Questo stimatore funziona davvero bene tranne che per piccoli campioni (<40 è spesso presunto). HC1-3 sono varie correzioni del campione finito. HC3 è generalmente il migliore.
Tuttavia, se ci sono effetti autoregressivi, le voci off-diagonali di sono diverse da zero, quindi viene prodotta una matrice di covarianza in scala basata su strutture autoregressive comunemente usate. Questa è la logica del "vcovHAC". Qui vengono prodotti metodi molto flessibili e generali per stimare l'effetto autoregressivo: i dettagli potrebbero andare oltre lo scopo della tua domanda. La funzione "meatHAC" è il cavallo di battaglia generale: il metodo predefinito è quello di Andrews. Newey-West è un caso speciale dello stimatore di errori autoregressivo generale. Questi metodi risolvono uno dei due problemi: 1. a quale velocità decade la correlazione tra osservazioni "adiacenti" e 2. qual è la distanza ragionevole tra due osservazioni? Questi Se si dispone di dati panel equilibrati, questo stimatore di covarianza è eccessivo.Tgee
gee
pacchetto invece specificando la struttura della covarianza AR-1
o simile.
Per quanto riguarda quale usare, dipende dalla natura dell'analisi dei dati e della domanda scientifica. Non consiglierei di adattare tutti i tipi e scegliere quello che sembra migliore, poiché si tratta di un problema di test multipli. Come ho accennato in precedenza, lo stimatore vcovHC è coerente anche in presenza di un effetto autoregressivo, quindi è possibile utilizzare e giustificare un "modello di correlazione di indipendenza operativa" in una varietà di circostanze.