vcovHC, vcovHAC, NeweyWest - quale funzione utilizzare?


10

Sto cercando di aggiornare il mio modello basato su lm () per ottenere errori e test standard corretti. Sono davvero confuso quale matrice VC usare. Le sandwichofferte di pacchetti vcovHC, vcovHACe NeweyWest. Mentre il primo rappresenta solo l'eteroschedasticità, gli ultimi due rappresentano sia la correlazione seriale che l'eteroschedasticità. Tuttavia, la documentazione non dice molto sulla differenza tra gli ultimi due (almeno non capisco). Guardando alla funzione stessa mi sono reso conto che NeweyWest in realtà chiama vcovHAC.

Empiricamente i risultati coeftest(mymodel, vcov. = vcovHAC)e coeftest(mymodel, vcov. = NeweyWest)sono pazzi diversi. Mentre vcovHACè in qualche modo vicino ai risultati ingenui, usando NeweyWest tutti i coefficienti diventano insignificanti (i test si avvicinano anche a 1).


Di solito le pagine di aiuto R forniscono link agli articoli. I dettagli precisi di solito risiedono lì. L'articolo di Zeileis, ad esempio, è disponibile gratuitamente e contiene molte informazioni.
mpiktas,

2
L'articolo di Zeileis specifica in che modo vcovHACè diverso da NeweyWest. Per riassumere, i diversi metodi HAC differiscono solo per la scelta dei pesi. NeweyWestha i pesi specificati, vcovHACè una funzione generale, che consente di fornire i propri pesi e, per impostazione predefinita, utilizza i pesi Andrews.
mpiktas,

@mpiktas: grazie per il riassunto. Poiché non ho specificato alcun peso, è necessario utilizzare i rispettivi pesi predefiniti. Ora che so, dovrei forse ribadire la mia domanda a: Perché pesi diversi predefiniti di vcovHAC e NeweyWest fanno una differenza così grande e come determinare i pesi? Voglio dire, sai quali pesi usano STATA o altri pacchetti?
hans0l0

tutti questi calcoli dipendono dal fatto che sono variabili stazionarie, dove sono i regressori e i disturbi. La stazionarietà è una proprietà un po 'restrittiva, quindi controlla se è valida. x t u txtutxtut
mpiktas,

Risposte:


3

Il "sandwich" in questione è due pezzi di pane definiti dalle informazioni attese che racchiudono una carne definita dalle informazioni osservate. Vedi i miei commenti qui e qui . Per una regressione lineare, l'equazione di stima è:

U(β)=XT(YXTβ)

Le informazioni previste (pane) sono:

A=U(β)β=(XTX)

Le informazioni osservate (carne) sono:

B=E(U(β)U(β)T)=XT(YXTβ)(YXTβ)TX

Si noti che il termine interno è una diagonale di residui costanti quando si incontra l'omoscedasticità, assunzione di dati indipendenti, quindi lo stimatore di covarianza sandwich che è dato da è la solita matrice di covarianza di regressione lineare dove è la varianza dei residui. Tuttavia, è piuttosto severo. Ottieni una classe di stimatori considerevolmente più ampia rilassando le ipotesi coinvolte attorno alla matrice residua : . σ 2 ( X T X ) - 1 σ 2 n × n R = ( Y - X T β ) ( Y - X T β )A1BA1σ2(XTX)1σ2n×n

R=(YXTβ)(YXTβ)

Lo vcovHCstimatore "HC0" è coerente anche quando i dati non sono indipendenti. Quindi non dirò che "assumiamo" che i residui siano indipendenti, ma dirò che utilizziamo "una struttura di covarianza indipendente funzionante". Quindi la matrice è sostituita da una diagonale dei residuiR

Rii=(YiβXI.)2,0 elsewhere

Questo stimatore funziona davvero bene tranne che per piccoli campioni (<40 è spesso presunto). HC1-3 sono varie correzioni del campione finito. HC3 è generalmente il migliore.

Tuttavia, se ci sono effetti autoregressivi, le voci off-diagonali di sono diverse da zero, quindi viene prodotta una matrice di covarianza in scala basata su strutture autoregressive comunemente usate. Questa è la logica del "vcovHAC". Qui vengono prodotti metodi molto flessibili e generali per stimare l'effetto autoregressivo: i dettagli potrebbero andare oltre lo scopo della tua domanda. La funzione "meatHAC" è il cavallo di battaglia generale: il metodo predefinito è quello di Andrews. Newey-West è un caso speciale dello stimatore di errori autoregressivo generale. Questi metodi risolvono uno dei due problemi: 1. a quale velocità decade la correlazione tra osservazioni "adiacenti" e 2. qual è la distanza ragionevole tra due osservazioni? Questi Se si dispone di dati panel equilibrati, questo stimatore di covarianza è eccessivo.Tgeegeepacchetto invece specificando la struttura della covarianza AR-1o simile.

Per quanto riguarda quale usare, dipende dalla natura dell'analisi dei dati e della domanda scientifica. Non consiglierei di adattare tutti i tipi e scegliere quello che sembra migliore, poiché si tratta di un problema di test multipli. Come ho accennato in precedenza, lo stimatore vcovHC è coerente anche in presenza di un effetto autoregressivo, quindi è possibile utilizzare e giustificare un "modello di correlazione di indipendenza operativa" in una varietà di circostanze.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.