Intuizione dello stimatore sandwich


20

Wikipedia e la vignetta del pacchetto sandwich R forniscono buone informazioni sulle ipotesi a supporto degli errori standard del coefficiente OLS e sullo sfondo matematico degli stimatori sandwich. Non sono ancora chiaro in che modo sia affrontato il problema dell'eteroscedasticità dei residui, probabilmente perché in primo luogo non capisco completamente la stima della varianza dei coefficienti OLS standard.

Qual è l'intuizione dietro lo stimatore sandwich?


5
Devi saperne di più sulla stima (o stima dell'estremo, come talvolta viene chiamata in econometria). Lo stimatore sandwich per la regressione è solo un caso speciale di una formula delta-metodo molto generale e, se capisci la seconda, non avrai problemi con la prima. Non c'è intuizione in quanto lo stimatore sandwich non cerca di modellare l'eteroschedasticità o fare qualcosa di specifico al riguardo; è solo uno stimatore di varianza diverso che funziona con una serie di ipotesi più generali rispetto allo stimatore OLS standard. M
Attacco

@StasK Grazie! Ti capita di conoscere qualche buona risorsa particolare sulle formule di stima M e delta-method?
Robert Kubrick,

La monografia di @Robert Huber "Robust Statistics" merita una visita.
Momo,

Risposte:


17

Per OLS, puoi immaginare che stai usando la varianza stimata dei residui (sotto il presupposto di indipendenza e omoscedasticità) come stima per la varianza condizionale degli . Nello stimatore basato su sandwich, stai usando i residui quadrati osservati come stima plug-in della stessa varianza che può variare tra le osservazioni.Yi

var(β^)=(XTX)1(XTdiag(var(Y|X))X)(XTX)1

Nella stima dell'errore standard dei minimi quadrati ordinari per la stima del coefficiente di regressione, la varianza condizionale del risultato viene trattata come costante e indipendente, in modo che possa essere stimata in modo coerente.

var^OLS(β^)=(XTX)1(r2XTX)(XTX)1

Per il sandwich, evitiamo una stima coerente della varianza condizionale e invece utilizziamo una stima plug-in della varianza di ciascun componente usando il residuo quadrato

var^RSE(β^)=(XTX)1(XTdiag(ri2)X)(XTX)1

Usando la stima della varianza del plug-in, otteniamo stime coerenti della varianza di dal teorema del limite centrale di Lyapunov.β^

Intuitivamente, questi residui quadrati osservati risolveranno qualsiasi errore inspiegabile a causa dell'eteroscedasticità che altrimenti sarebbe stata inaspettata dal presupposto di una varianza costante.


È il tuo ultimo paragrafo che ho difficoltà a cogliere. Puoi illustrare?
Robert Kubrick,

Non è SE nelle tue formule, AdamO, è SE ^ 2 ... in qualunque modo di matrice intenderai questo.
Attacco

@StasK buon punto. Forse un cappello varianza è meglio. Stavo confondendo una terminologia multivariata e univariata.
AdamO,

1
@RobertKubrick Nell'ultimo paragrafo, sottolineo che la differenza chiave negli stimatori è come rappresentiamo il termine di varianza condizionale . Nel modello di regressione lineare, stimiamo costantemente i residui, ma con il sandwich, utilizziamo semplicemente una stima plug-in della varianza condizionale per l' -esimo termine usando i residui quadrati. In presenza di eteroscedasticità, i punti con residui quadrati relativamente grandi hanno una corrispondente varianza stimata corrispondente e ciò riduce la loro influenza sulle stime di errore standard. var(Y|X)i
AdamO,

Modifica: ho detto che le stime var OLS implicano "stime coerenti dei residui", quando intendevo dire "stima coerente della varianza dei residui".
AdamO,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.