Qual è la differenza matematica tra effetti casuali e fissi?


26

Ho trovato molto su Internet per quanto riguarda l'interpretazione di effetti casuali e fissi. Tuttavia non sono riuscito a ottenere una fonte che fissa quanto segue:

Qual è la differenza matematica tra effetti casuali e fissi?

Con questo intendo la formulazione matematica del modello e il modo in cui i parametri sono stimati.


1
Bene, gli effetti fissi influenzano la media di una distribuzione congiunta e gli effetti casuali influenzano la varianza e la struttura dell'associazione. Cosa intendi esattamente con "differenza matematica"? Stai chiedendo come cambia la probabilità? Può essere più preciso?
Macro



1
La domanda non sembra distinguere lo sfondo da cui viene disegnata. Questa terminologia in Panel Data Economics è diversa da quella delle altre scienze sociali che utilizzano modelli multilivello. La domanda richiede ulteriori chiarimenti. Altrimenti, questo è fuorviante per coloro che arrivano qui da entrambi i precedenti senza sapere che esiste una definizione alternativa in un campo correlato.
Luchonacho,

Risposte:


21

Il modello più semplice con effetti casuali è il modello ANOVA a senso unico con effetti casuali, dato dalle osservazioni con ipotesi distributive: ( y i jμ i ) iid N ( μ i , σ 2 w ) ,yij

(yijμi)iidN(μi,σw2),j=1,,J,μiiidN(μ,σb2),i=1,,I.

Qui gli effetti casuali sono i . Sono variabili casuali, mentre sono numeri fissi nel modello ANOVA con effetti fissi.μi

Ad esempio ognuna delle tre tecnici in un laboratorio registra una serie di misurazioni e è il misurazione -esimo di tecnico . Chiama il "vero valore medio" della serie generata dal tecnico ; questo è un parametro di un po 'artificiale, è possibile vedere come il valore medio che tecnico sarebbe ottenuto se lui / lei aveva registrato un enorme serie di misurazioni.y i j j i μ i i μ i ii=1,2,3yijjiμiiμii

Se sei interessato a valutare , , (ad esempio per valutare la distorsione tra operatori), devi usare il modello ANOVA con effetti fissi.μ 2 μ 3μ1μ2μ3

Devi usare il modello ANOVA con effetti casuali quando sei interessato alle varianze e definiscono il modello e alla varianza totale (vedi sotto). La varianza è la varianza delle registrazioni generate da un tecnico (si presume che sia la stessa per tutti i tecnici) e è chiamata varianza tra tecnici. Forse idealmente, i tecnici dovrebbero essere scelti a caso. σ 2 b σ 2 b + σ 2 w σ 2 w σ 2 bσw2σb2 σb2+σw2σw2σb2

Questo modello riflette la decomposizione della formula di varianza per un campione di dati: inserisci qui la descrizione dell'immagine

Varianza totale = varianza delle medie medie delle intra-varianze+

che si riflette nel modello ANOVA con effetti casuali: inserisci qui la descrizione dell'immagine

In effetti, la distribuzione di è definita dalla sua distribuzione condizionale data e dalla distribuzione di . Se si calcola la distribuzione "incondizionata" di allora troviamo .yijμ i μ i y i j y i jN ( μ , σ 2 b + σ 2 w )(yij)μiμiyijyijN(μ,σb2+σw2)

Vedi la diapositiva 24 e la diapositiva 25 qui per immagini migliori (devi salvare il file pdf per apprezzare le sovrapposizioni, non guardare la versione online).


1
(+1) Figure molto belle!
ameba dice di reintegrare Monica il

1
Grazie @amoeba, il mio codice per i momenti di inerzia è disponibile sul mio blog: stla.github.io/stlapblog/posts/Variance_inertia.html
Stéphane Laurent

Non capisco Se ho un numero di misurazioni eseguite da un numero di tecnici, perché ho bisogno di un ANOVA? Posso non solo adattare un gaussiano ai risultati di ciascun tecnico e ottenere un e per ciascuno di essi? Cosa mi permette di fare il tuo modo di risolvere questo, cosa che a mio modo non lo fa? σμσ
TheChymera,

@TheChymera ANOVA è il presupposto di un comune . Con questo presupposto si ottiene un intervallo di confidenza più breve. Ma il tuo commento riguarda i motivi per utilizzare un ANOVA con varianza comune rispetto a un ANOVA con varianze diverse, questo non è proprio l'argomento qui. σ
Stéphane Laurent,

@ StéphaneLaurent Quale ANOVA è il presupposto di un comune ? - Inoltre, a cosa sono comuni questi ? Hai detto "Se sei interessato a valutare μ1, μ2, μ3 (ad esempio per valutare la distorsione tra operatori), allora devi usare il modello ANOVA con effetti fissi." Qual è la formula del metodo ANOVA con effetti fissi e come ti informa su senza informarti su ? Inoltre, come può fornirti una stima di senza fornire tutte le informazioni necessarie per calcolare ? (e viceversa per il modello di effetti casuali)σ μ i σ 2 b μ i σ 2 settσσμiσb2μiσw2
TheChymera,

16

Fondamentalmente, ciò che penso sia la differenza più distinta se si modella un fattore come casuale, è che si presume che gli effetti siano tratti da una distribuzione normale comune.

Ad esempio, se si dispone di una sorta di modello per quanto riguarda i voti e si desidera tenere conto dei dati dei propri studenti provenienti da scuole diverse e si modella la scuola come fattore casuale, ciò significa che si presume che le medie per scuola siano normalmente distribuite. Ciò significa che due fonti di variazione sono la modellizzazione: la variabilità a scuola dei voti degli studenti e la variabilità tra le scuole.

Ciò si traduce in qualcosa chiamato pool parziale . Considera due estremi:

  1. La scuola non ha alcun effetto (tra la variabilità della scuola è zero). In questo caso sarebbe ottimale un modello lineare che non tiene conto della scuola.
  2. La variabilità della scuola è maggiore della variabilità degli studenti. Quindi in pratica devi lavorare a livello di scuola anziché a livello di studenti (meno # campioni). Questo è fondamentalmente il modello in cui conti la scuola usando effetti fissi. Questo può essere problematico se hai pochi campioni per scuola.

Stimando la variabilità ad entrambi i livelli, il modello misto fa un intelligente compromesso tra questi due approcci. Soprattutto se hai un #student non così grande per scuola, questo significa che otterrai un restringimento degli effetti per le singole scuole come stimato dal modello 2 verso la media complessiva del modello 1.

Questo perché i modelli dicono che se hai una scuola con due studenti inclusi, che è meglio di ciò che è "normale" per la popolazione delle scuole, è probabile che una parte di questo effetto sia spiegata dal fatto che la scuola è stata fortunata nella scelta dei due studenti hanno guardato. Non lo fa alla cieca, lo fa in base alla stima della variabilità all'interno della scuola. Ciò significa anche che i livelli di effetto con un minor numero di campioni sono maggiormente spinti verso la media complessiva rispetto alle grandi scuole.

L'importante è che sia necessario scambiare i livelli del fattore casuale. Ciò significa che in questo caso le scuole sono (per tua conoscenza) scambiabili e tu non sai nulla che le rende distinte (tranne una sorta di documento d'identità). Se si dispone di ulteriori informazioni, è possibile includerle come ulteriore fattore, è sufficiente che le scuole siano scambiabili a seconda delle altre informazioni considerate.

Ad esempio, avrebbe senso presumere che gli adulti di 30 anni che vivono a New York siano scambiabili a seconda del genere. Se si dispone di ulteriori informazioni (età, etnia, istruzione), sarebbe opportuno includere anche tali informazioni.

OTH se hai studiato con un gruppo di controllo e tre gruppi di malattie selvaggiamente differenti, non ha senso modellare il gruppo come casuale poiché una malattia specifica non è scambiabile. Tuttavia, a molte persone piace l'effetto di restringimento così bene che discuterebbero ancora per un modello di effetti casuali, ma questa è un'altra storia.

Ho notato che non ho approfondito troppo la matematica, ma sostanzialmente la differenza è che il modello a effetti casuali ha stimato un errore normalmente distribuito sia a livello di scuole che a livello di studenti mentre il modello a effetti fissi ha l'errore solo su il livello degli studenti. Soprattutto ciò significa che ogni scuola ha il proprio livello che non è collegato agli altri livelli da una distribuzione comune. Ciò significa anche che il modello fisso non consente l'estrapolazione a uno studente della scuola non incluso nei dati originali mentre il modello a effetti casuali lo fa, con una variabilità che è la somma del livello dello studente e della variabilità a livello di scuola. Se sei particolarmente interessato alla probabilità, potremmo lavorarci su.


1
(+1) Un'ottima risposta, sorprendentemente sottovalutata. Ho notato un errore di battitura confuso: "esclusi" dovrebbe leggere "incluso". A parte questo: quale sarebbe una differenza pratica attesa tra il trattamento della scuola come effetto casuale o fisso? Comprendo che il trattamento come fisso non consentirebbe di prevedere un rendimento degli studenti di una nuova scuola, ma per quanto riguarda le differenze sui dati disponibili? Supponiamo che altri effetti fissi siano il genere, la razza e il peso degli studenti (qualunque cosa). Trattare la scuola come casuale / fissa influenza il potere dei principali effetti o interazioni di interesse? Altre differenze?
ameba dice di reintegrare Monica il

3
@amoeba Lasciando da parte la coerenza, l'MSE su un coefficiente a livello di studente può essere più o meno efficiente in un modello di effetti casuali rispetto a uno fisso a seconda, tra l'altro, del livello di correlazione tra lo studente X e l'effetto casuale, i numeri dei cluster, ecc. . Clark e Linzer 2012 ha simulazione risultati.
conjugateprior

1
@conjugateprior Wow, grazie mille per questo commento! Ho letto il documento collegato ed è la spiegazione più chiara del problema che ho visto. Ho trascorso un considerevole periodo di tempo a leggere qui vari CV su effetti fissi / casuali, ma non sono riuscito a capire quando si dovrebbero usare gli uni sugli altri e perché. Leggere C&L mi ha chiarito molte cose. Vuoi forse scrivere una risposta da qualche parte sul CV presentando il riassunto di questo e / o documenti correlati? Sto facendo una ricompensa sul thread [modello misto] più votato e sarò felice di premiarne un altro anche lì.
ameba dice di reintegrare Monica

@Erik, ho modificato per correggere "istruzione parziale" in "pool parziale". Penso che sia stato un refuso ma mi scuso se fosse un gioco di parole previsto!
ameba dice di reintegrare Monica

2

Nella terra di econ, tali effetti sono intercettazioni (o costanti) specifiche per individuo che non sono osservate, ma che possono essere stimate utilizzando i dati del panel (osservazione ripetuta sulle stesse unità nel tempo). Il metodo di stima degli effetti fissi consente la correlazione tra le intercettazioni specifiche dell'unità e le variabili esplicative indipendenti. Gli effetti casuali no. Il costo dell'utilizzo degli effetti fissi più flessibili è che non è possibile stimare il coefficiente su variabili invarianti nel tempo (come genere, religione o razza).

NB Altri campi hanno una propria terminologia, che può essere piuttosto confusa.


(-1) questo non dice nulla sulla differenza matematica tra effetti fissi e casuali
Macro

1
@Macro concordato. Prima che ciò accada, sarebbe utile sapere se la terminologia econ è ciò che l'OP sta cercando. Avrei dovuto essere più chiaro su questo.
Dimitriy V. Masterov

OK. In tal caso, potrebbe essere più appropriato come commento, non diresti?
Macro

L'affermazione "Il costo dell'utilizzo degli effetti fissi più flessibili è che non è possibile stimare il coefficiente su variabili invarianti nel tempo" non è vero. Ho appena fatto una simulazione in cui hai ripetuto misurazioni su individui e un singolo predittore binario che non varia nel tempo. Se includi un effetto fisso per ID e uno per il predittore binario, puoi sicuramente stimare il coefficiente sul predittore binario (anche se, lo ammetto, se non hai molte misurazioni ripetute, la stima ha un errore standard di grandi dimensioni).
Macro

3
Andrew Gelman (che non è un economista), elenca 5 definizioni distinte nel suo documento ANOVA: stat.columbia.edu/~gelman/research/published/banova7.pdf .
Dimitriy V. Masterov

2

In un pacchetto software standard (ad es. R lmer), la differenza di base è:

  • gli effetti fissi sono stimati con la massima verosimiglianza (minimi quadrati per un modello lineare)
  • gli effetti casuali sono stimati da Bayes empirici (minimi quadrati con una certa contrazione per un modello lineare, in cui il parametro di contrazione è scelto con la massima probabilità)

Se stai diventando bayesiano (ad esempio WinBUGS), allora non c'è vera differenza.


3
Non sono assolutamente d'accordo sul fatto che non ci sia differenza. È possibile adattare un modello a effetti fissi bayesiani con tutti i coefficienti con priori separati o un modello misto bayesiano in cui sono presenti iperparametri.
Erik,

Se stai diventando bayesiano la differenza è simile a questa .
conjugateprior

@Simon è una risposta precisa e croccante. Avrei dovuto menzionarlo molto tempo fa.
Subhash C. Davar,

-3

@Joke Un modello a effetti fissi implica che la dimensione dell'effetto generata da uno studio (o un esperimento) è fissa, ovvero la ripetizione delle misurazioni per un intervento ha la stessa dimensione di effetto. Presumibilmente, le condizioni esterne e interne per l'esperimento non cambiano. Se hai una serie di prove e / o studi in condizioni diverse, avrai dimensioni di effetto diverse. Le stime parametriche di media e varianza per un insieme di dimensioni dell'effetto possono essere realizzate presumendo che si tratti di effetti fissi o di effetti casuali (realizzati da una superpopolazione). Penso che la materia possa essere risolta con l'aiuto di statistiche matematiche.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.