Quando utilizzare gli effetti fissi rispetto all'utilizzo di cluster SE?


19

Supponiamo di avere una singola sezione trasversale di dati in cui gli individui si trovano all'interno di gruppi (ad esempio studenti all'interno delle scuole) e si desidera stimare un modello del modulo in Y_i = a + B*X_icui Xè un vettore di caratteristiche di livello individuale e auna costante.

In questo caso, supponiamo che l'eterogeneità tra i gruppi non osservata distorca le vostre stime puntuali Be le loro SE poiché è correlata con la vostra variabile di interesse indipendente.

Un'opzione è quella di raggruppare i SE in gruppi (scuole). Un altro è includere FE di gruppo. Un altro è usare entrambi. Cosa bisogna considerare quando si sceglie tra queste opzioni? Non è particolarmente chiaro il motivo per cui si potrebbero raggruppare gli SE per gruppo E usare il gruppo FE. Nel mio caso specifico, ho 35 gruppi e 5.000 individui annidati all'interno di ciascun gruppo. Ho seguito la discussione in questo pdf , ma non è molto chiaro il perché e quando si potrebbero usare sia gli cluster SE che gli effetti fissi.

(Si prega di discutere i vantaggi e gli svantaggi di SE raggruppati rispetto a FE invece di suggerire che si adatta solo a un modello multilivello.)

Risposte:


22

Entrambi gli approcci, utilizzando effetti fissi di gruppo e / o errori standard adeguati al cluster, tengono conto delle diverse problematiche relative ai dati raggruppati (o panel) e li vedrei chiaramente come approcci distinti. Spesso vuoi usarli entrambi:

Prima di tutto, conto dell'errore standard corretto per il cluster per la correlazione all'interno del cluster o l'eteroscedasticità che lo stimatore degli effetti fissi non prende in considerazione se non si è disposti a fare ulteriori ipotesi, vedere le diapositive della lezione di Imbens e Wooldridge per una buona discussione di e lunghi pannelli e vari problemi relativi a questo problema . C'è anche un romanzo su questo argomento di Cameron e Miller: A Practitioner's Guide to Cluster-Robust Inference che potrebbe essere interessante per te. Se non si desidera modellare la matrice varianza-covarianza e si sospetta la presenza di una correlazione all'interno del cluster, si consiglia di utilizzare un solido errore standard del cluster perché la distorsione nella propria SE potrebbe essere grave (molto più problematica rispetto all'eteroscedasticità, vedereAngrist & Pischke Capitolo III.8 per una discussione su questo argomento. Ma hai bisogno di abbastanza cluster (Angrist e Pischke dicono 40-50 come ruolo del pollice). L'errore standard corretto dal cluster tiene conto dell'errore standard ma lascia invariate le stime dei punti (l'errore standard salirà di solito)!

La stima degli effetti fissi tiene conto dell'eterogeneità invariante nel tempo non osservata (come hai detto tu). Questo può essere positivo o negativo: a portata di mano, sono necessarie meno ipotesi per ottenere stime coerenti. D'altra parte, butti via molta varianza che potrebbe essere utile. Alcune persone come Andrew Gelman preferiscono la modellazione gerarchica agli effetti fissi, ma qui le opinioni differiscono. La stima degli effetti fissi cambierà sia le stime puntuali che quelle degli intervalli (anche qui l'errore standard sarà generalmente più elevato).

Riassumendo: l'errore standard robusto del cluster è un modo semplice per tenere conto di possibili problemi relativi ai dati del cluster se non si desidera preoccuparsi di modellare la correlazione tra cluster e tra cluster (e ci sono abbastanza cluster disponibili). La stima a effetti fissi utilizzerà solo determinate variazioni, quindi dipende dal modello se si desidera effettuare stime basate su meno variazioni o meno. Ma senza ulteriori ipotesi la stima degli effetti fissi non si occuperà dei problemi relativi alla correlazione tra cluster per la matrice di varianza. Né l'errore standard solido del cluster terrà conto dei problemi relativi all'uso della stima degli effetti fissi.


2
Esito positivo. La domanda chiave che rimane è perché si vorrebbe ENTRAMBI. Imbens e Wooldridge lo coprono in una certa misura.
Domanda

13

Gli effetti fissi servono a rimuovere l'eterogeneità non osservata FRA diversi gruppi nei dati.

Non sono d'accordo con l'implicazione nella risposta accettata secondo cui la decisione di utilizzare un modello FE dipenderà dal fatto che si desideri utilizzare "meno variazioni o meno". Se la tua variabile dipendente è influenzata da variabili non osservabili che variano sistematicamente tra i gruppi nel tuo pannello, il coefficiente di qualsiasi variabile correlata a questa variazione sarà distorto. A meno che le tue variabili X non siano state assegnate in modo casuale (e non lo saranno mai con i dati di osservazione), di solito è abbastanza facile rendere l'argomento per la distorsione delle variabili omesse. si puòessere in grado di controllare alcune delle variabili omesse con un buon elenco di variabili di controllo, ma se una forte identificazione è il tuo obiettivo numero 1, anche un ampio elenco di controlli può lasciare spazio ai lettori critici per mettere in dubbio i tuoi risultati. In questi casi, di solito è una buona idea usare un modello a effetti fissi.

Gli errori standard raggruppati sono per la contabilizzazione di situazioni in cui le osservazioni all'interno di ciascun gruppo non sono considerate (distribuite in modo indipendente e identico).

Un esempio classico è se nel tempo hai molte osservazioni per un panel di aziende. Puoi tenere conto degli effetti fissi a livello di impresa, ma potrebbero esserci ancora delle variazioni inspiegabili nella tua variabile dipendente che sono correlate nel tempo. In generale, quando si lavora con i dati delle serie temporali, di solito è sicuro assumere una correlazione seriale temporale nei termini di errore all'interno dei propri gruppi. Queste situazioni sono i casi d'uso più ovvi per gli ES cluster.

Alcuni esempi illustrativi:

Se disponi di dati sperimentali in cui assegni i trattamenti in modo casuale, ma fai ripetute osservazioni per ciascun individuo / gruppo nel tempo, ti sarebbe giustificato omettere gli effetti fissi, ma vorrai raggruppare i tuoi SE.

In alternativa, se hai molte osservazioni per gruppo per dati non sperimentali, ma ogni osservazione all'interno del gruppo può essere considerata come un disegno iid dal loro gruppo più grande (ad esempio, hai osservazioni da molte scuole, ma ogni gruppo è un sottoinsieme disegnato in modo casuale degli studenti della loro scuola), vorresti includere effetti fissi ma non avresti bisogno di SE raggruppati.


2

Queste risposte vanno bene, ma la risposta più recente e migliore è fornita da Abadie et al. (2019) "Quando è necessario regolare gli errori standard per il clustering?" Con effetti fissi, uno dei motivi principali per raggruppare è l'eterogeneità degli effetti del trattamento tra i cluster. Vi sono altri motivi, ad esempio se i cluster (ad es. Aziende, paesi) sono un sottoinsieme dei cluster nella popolazione (di cui si sta deducendo). Il clustering è un problema di progettazione è il messaggio principale dell'articolo. Non farlo alla cieca.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.