Qual è la differenza tra effetti casuali, effetti fissi e modello marginale?


49

Sto cercando di espandere la mia conoscenza delle statistiche. Vengo da un background di scienze fisiche con un approccio "basato sulla ricetta" ai test statistici, dove diciamo che è continuo, è normalmente distribuito - regressione OLS .

Nella mia lettura mi sono imbattuto nei termini: modello di effetti casuali, modello di effetti fissi, modello marginale. Le mie domande sono:

  • In termini molto semplici, cosa sono?
  • Quali sono le differenze tra loro?
  • C'è qualcuno di loro sinonimi?
  • Dove rientrano in questa classificazione i test tradizionali come la regressione OLS, ANOVA e ANCOVA?

Sto solo cercando di decidere dove andare dopo con lo studio personale.



1
@gung: La risposta a cui assegnerai il premio in realtà supera di gran lunga tutte le risposte nel thread "principale" sulle differenze tra effetti fissi / casuali (collegati nel commento sopra). Tale domanda ha oltre 40 voti e una risposta accettata con 25 voti, che purtroppo non è molto utile. Dovremmo forse unire questi thread? Immagino che ciò significherebbe che l'OP N26 perderà i voti delle domande, ma il loro account non sembra essere più attivo comunque. Non sono sicuro di quale sia la migliore linea d'azione.
ameba dice Ripristina Monica il

1
Grazie @amoeba, penso che anche questo meriti più attenzione. Mi sembra che questa domanda, sebbene intitolata in modo simile, sia in realtà leggermente diversa (e forse erroneamente intitolata). Non ho l'autorità per unirle. Ho appena aggiunto un commento lì che collega a questa discussione. Perché non sollevare la domanda su cosa fare con questi thread su meta.CV e vedremo cosa pensa la gente?
gung - Ripristina Monica

Risposte:


53

Questa domanda è stata parzialmente discussa in questo sito come di seguito, e le opinioni sembrano contrastanti.

Tutti i termini sono generalmente correlati a dati longitudinali / panel / cluster / gerarchici e misure ripetute (nel formato di regressione avanzata e ANOVA), ma hanno significati multipli in diversi contesti. Vorrei rispondere alla domanda in formule basate sulla mia conoscenza.

Modello a effetti fissi

  • In biostatistica, gli effetti fissi, indicati come nell'equazione (*) di seguito, di solito si combinano con effetti casuali. Ma il modello a effetti fissi è anche definito per presumere che le osservazioni siano indipendenti, come l'impostazione della sezione trasversale, come in Longitudinal Data Analysis of Hedeker and Gibbons (2006).β
  • In econometria, il modello a effetti fissi può essere scritto come where è l'intercetta fissa (non casuale) per ogni soggetto ( ), oppure possiamo anche avere un effetto fisso come per ogni misurazione ripetuta ( ); indica le covariate.
    yij=xijβ+ui+ϵij
    uiiujjxij
  • Nella meta-analisi, il modello a effetto fisso assume che l'effetto sottostante sia lo stesso in tutti gli studi (ad esempio Mantel e Haenszel, 1959).

Modello a effetti casuali

  • In biostatistica, il modello a effetti casuali (Laird e Ware, 1982) può essere scritto come dove si presume che segua una distribuzione. indica le covariate per effetti fissi e indica le covariate per effetti casuali.
    (*)yij=xijβ+zijui+eij
    uixijzij
  • In econometria, il modello a effetti casuali può riferirsi solo al modello di intercettazione casuale come nella biostatistica, ovvero e è uno scalare.zij=1ui
  • Nella meta-analisi, il modello a effetti casuali assume effetti eterogenei attraverso gli studi (DerSimonian e Laird, 1986).

Modello marginale

Il modello marginale viene generalmente confrontato con il modello condizionale (modello a effetti casuali) e il primo si concentra sulla media della popolazione (prendere un modello lineare per un esempio) mentre quest'ultimo si occupa della media condizionaleL'interpretazione e la scala dei coefficienti di regressione tra modello marginale e modello a effetti casuali sarebbero diverse per i modelli non lineari (ad es. Regressione logistica). Lascia , quindi

E(yij)=xijβ,
E(yij|ui)=xijβ+zijui.
h(E(yij|ui))=xijβ+zijui
E(yij)=E(E(yij|ui))=E(h1(xijβ+zijui))h1(xijβ),
meno che banalmente la funzione di collegamento sia il collegamento di identità (modello lineare ) o (nessun effetto casuale). Buoni esempi includono equazioni di stima generalizzate (GEE; Zeger, Liang e Albert, 1988) e modelli multilivello emarginati (Heagerty e Zeger, 2000).hui=0

Grazie Randel. Un'altra domanda sulla terminologia del "modello misto". Per quanto ho capito, in biostatistica la tua equazione (*) sarebbe chiamata un modello misto perché contiene sia effetti casuali che fissi. È corretto? Ma il termine "modello misto" è usato anche in econometria? In tal caso, a cosa si riferisce?
ameba dice di reintegrare Monica il

Sì, l'equazione (*) è anche chiamata modello misto nelle statistiche (bio). Per quanto ne so, l'economista potrebbe non chiamarlo "modello misto", ma "modello a effetti casuali" o "modello a coefficienti casuali", se interessati all'eterogeneità dei cluster. Per me, l'unica differenza è l'assunzione di effetti specifici per cluster, fissi o casuali.
Randel,

1
@skan indica le covariate per effetti casuali. È un vettore e è la trasposizione. zijzij
Randel

1
Ecco un esempio dettagliato. Spero che sia d'aiuto. @skan
Randel,

1
@skan Non è consigliabile avere entrambi, è sufficiente. Ecco un esempio perfetto.
Randel,

1

Correggimi se sbaglio qui:

Concettualmente, ci sono quattro possibili effetti: intercetta fissa, coefficiente fisso, intercetta casuale, coefficiente casuale. La maggior parte dei modelli di regressione sono "effetti casuali", quindi hanno intercettazioni casuali e coefficienti casuali. Il termine "effetto casuale" è stato utilizzato in contrasto con "effetto fisso".

L '"effetto fisso" è quando una variabile ha effetto su parte del campione, ma non su tutti. La versione più semplice di un modello a effetti fissi (concettualmente) sarebbe una variabile fittizia, per un effetto fisso con un valore binario. Questi modelli hanno una singola intercettazione casuale, coefficienti di effetto fissi e coefficienti variabili casuali.

Il livello successivo di complicazione (concettualmente) è quando l'effetto fisso non è binario, ma nominale, con molti valori. In questo caso, ciò che viene generato è un modello con molte intercettazioni (una per ciascuno dei valori nominali). Qui è dove si ottengono le classiche "linee multiple" di un modello di dati del pannello , in cui ciascuna delle "opzioni" di una variabile di effetto fisso ottiene il proprio effetto. La virtù di gettare tutte le diverse serie di dati specifici di un fattore in una singola regressione (piuttosto che fare ogni fattore dell'effetto fisso come propria regressione) è che si arriva a riunire la varianza di tutti i diversi effetti in un'unica equazione, e così ottenere valori migliori (più certi) per tutti i tuoi coefficienti.

Il "terzo livello" della complicazione sarebbe quando l '"effetto fisso" è esso stesso una variabile casuale, tranne per il fatto che i suoi effetti sono "fissi" per influenzare solo un sottoinsieme del campione. A quel punto il modello avrebbe un'intercettazione casuale, più intercettazioni fisse e più variabili casuali. Penso che questo sia ciò che è noto come modello di "effetti misti"?

I modelli "a effetto misto" vengono utilizzati per la modellazione multilivello (MLM), in quanto gli "effetti fissi" possono essere utilizzati per annidare un sottoinsieme di dati all'interno di un altro. Questo raggruppamento può avere più livelli, con gli studenti nidificati all'interno delle classi, nidificati all'interno delle scuole. La scuola ha un effetto fisso sulle aule e le aule sugli studenti. (La scuola può o meno essere un effetto fisso sullo studente, a seconda del disegno sperimentale - non sono sicuro)

I modelli di dati del pannello sono modelli di "effetti misti", ma utilizzano due dimensioni per il raggruppamento, in genere tempo e una sorta di categoria.


Non sono sicuro di cosa intendi per "set di scelte di effetti fissi: A o B; ... Gli effetti casuali includono cose come il peso corporeo". Vuoi dire che gli effetti fissi sono per le variabili discrete, gli effetti casuali sono per le variabili continue? Inoltre, non sono sicuro del perché "l'utilizzo di più variabili fittizie per la stessa cosa è statisticamente inappropriato". Il modello a effetti fissi in econometria ha una variabile fittizia per ciascun "pannello". Non posso essere d'accordo con i "modelli misti" ... Avendo le intercettazioni "fisse" per raggruppamento, non hanno più nemmeno un'intercettazione casuale ". Molti modelli a effetti misti hanno un'intercettazione casuale.
Randel,

La mia comprensione è imperfetta. Modificherò la mia risposta e riproverò.
Mox,

È possibile che una variabile appaia contemporaneamente come effetto fisso e come effetto casuale?
skan

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.