Quando utilizzare il modello a effetti misti?


11

I modelli di effetti misti lineari sono estensioni dei modelli di regressione lineare per i dati raccolti e riepilogati in gruppi. Il vantaggio principale è che i coefficienti possono variare rispetto a una o più variabili di gruppo.

Tuttavia, sto lottando con quando utilizzare il modello a effetti misti? Elaborerò le mie domande usando un esempio di giocattolo con casi estremi.

Supponiamo di voler modellare l'altezza e il peso degli animali e utilizziamo le specie come variabili di raggruppamento.

  • Se diversi gruppi / specie sono davvero diversi. Di 'un cane e un elefante. Penso che non abbia senso utilizzare un modello di effetti misti, dovremmo costruire un modello per ogni gruppo.

  • Se diversi gruppi / specie sono davvero simili. Dì una cagna e un cane maschio. Penso che potremmo voler usare il genere come variabile categoriale nel modello.

Quindi, suppongo che dovremmo usare il modello a effetti misti nei casi intermedi? Diciamo, il gruppo è gatto, cane, coniglio, sono animali di dimensioni simili ma diversi.

C'è qualche argomento formale da suggerire quando utilizzare il modello di effetti misti, ovvero come tracciare linee tra

  1. Creazione di modelli per ciascun gruppo
  2. Modello ad effetto misto
  3. Utilizzare il gruppo come variabile categoriale in regressione

Il mio tentativo: il metodo 1 è il "modello più complesso" / minor grado di libertà e il metodo 3 è il "modello più semplice" / più grado di libertà. E il modello di effetti misti è nel mezzo. Potremmo considerare quanti dati e quanti dati complicati dobbiamo selezionare il modello giusto secondo Bais Variance Trade Off.


5
Questo è discusso in molti thread su questo forum. Ne hai cercato qualcuno? Nota che la tua opzione con "variabile categoriale" è ciò che viene chiamato "effetto fisso" (di variabile di raggruppamento), mentre quello che intendi per "uso di un modello misto" sta usando un "effetto casuale". Quindi quello che stai chiedendo è quando usare fisso e quando usare l'effetto casuale. Ci sono varie opinioni su questa domanda e puoi trovare molte discussioni qui sul CV. Potrei pubblicare alcuni link in seguito.
amoeba,

Inoltre, la differenza tra "costruire modelli separati" e "usare una variabile categoriale" non mi è chiara. activity ~ condition + species + condition*species- utilizza questa speciescome variabile categoriale, ma è del tutto equivalente a una regressione separata activity ~ conditionper ciascuna specie separatamente.
amoeba,

2
Controlla questa discussione: stats.stackexchange.com/questions/120964/… , non risponde direttamente alla tua domanda, ma fornisce una discussione strettamente correlata alla tua domanda.
Tim

3
Bene, hai letto stats.stackexchange.com/a/151800/28666 , per iniziare?
amoeba,

2
"Se diversi gruppi / specie sono davvero diversi. Di 'un cane e un elefante. Penso che non abbia senso usare un modello a effetti misti, dovremmo costruire un modello per ogni gruppo." Questo è vero solo se ti aspetti che gli effetti di tutte le altre caratteristiche differiscano per specie. Questo è, nella maggior parte dei casi, un presupposto troppo liberale.
Matthew Drury,

Risposte:


8

Temo di avere la risposta sfumata e forse insoddisfacente che sia una scelta soggettiva da parte del ricercatore o dell'analista di dati. Come menzionato altrove in questo thread, non è sufficiente dire semplicemente che i dati hanno una "struttura nidificata". Ad essere onesti, tuttavia, questo è il numero di libri che descrivono quando utilizzare i modelli multilivello. Ad esempio, ho appena estratto dal mio scaffale il libro di Joop Hox Multilevel Analysis , che dà questa definizione:

Un problema multilivello riguarda una popolazione con una struttura gerarchica.

Anche in un buon libro di testo, la definizione iniziale sembra essere circolare. Penso che ciò sia in parte dovuto alla soggettività nel determinare quando utilizzare quale tipo di modello (incluso un modello multilivello).

Un altro libro, West, Welch e Galecki's Linear Mixed Models afferma che questi modelli sono per:

variabili di risultato in cui i residui sono normalmente distribuiti ma potrebbero non essere indipendenti o avere una varianza costante. I progetti di studio che portano a set di dati che possono essere opportunamente analizzati utilizzando gli LMM includono (1) studi con dati raggruppati, come studenti in aule, o disegni sperimentali con blocchi casuali, come lotti di materie prime per un processo industriale, e (2) studi su misure longitudinali o ripetute, in cui i soggetti vengono misurati ripetutamente nel tempo o in condizioni diverse.

Finch, Bolin e Kelley Multilevel Modeling in R parla anche della violazione dell'ipotesi iid e dei residui correlati:

Di particolare importanza nel contesto della modellazione multilivello è l'assunzione [nella regressione standard] di termini di errore distribuiti in modo indipendente per le singole osservazioni all'interno di un campione. Questo presupposto significa essenzialmente che non ci sono relazioni tra gli individui nel campione per la variabile dipendente una volta che le variabili indipendenti nell'analisi sono state prese in considerazione.

Credo che un modello multilivello abbia senso quando c'è motivo di credere che le osservazioni non siano necessariamente indipendenti l'una dall'altra. Qualunque account "cluster" per questa non indipendenza può essere modellato.

Un esempio ovvio sarebbero i bambini in classe: stanno tutti interagendo tra loro, il che potrebbe portare i loro punteggi dei test a essere non indipendenti. Che cosa succede se una classe ha qualcuno che pone una domanda che porta a coprire materiale in quella classe che non è coperto in altre classi? E se l'insegnante è più sveglio per alcune lezioni rispetto ad altre? In questo caso, ci sarebbe una certa non indipendenza dei dati; in parole multilivello, potremmo aspettarci che una certa varianza nella variabile dipendente sia dovuta al cluster (cioè alla classe).

Il tuo esempio di cane contro elefante dipende dalle variabili indipendenti e dipendenti di interesse, credo. Ad esempio, supponiamo di chiedere se vi è un effetto della caffeina a livello di attività. Gli animali provenienti da tutto lo zoo sono assegnati in modo casuale a prendere una bevanda con caffeina o una bevanda di controllo.

Se siamo un ricercatore interessato alla caffeina, potremmo specificare un modello multilivello, perché ci teniamo davvero all'effetto della caffeina. Questo modello sarebbe specificato come:

activity ~ condition + (1+condition|species)

Ciò è particolarmente utile se ci sono un gran numero di specie su cui stiamo testando questa ipotesi. Tuttavia, un ricercatore potrebbe essere interessato agli effetti specifici della specie sulla caffeina. In tal caso, potrebbero specificare le specie come effetto fisso:

activity ~ condition + species + condition*species

Questo ovviamente è un problema se ci sono, diciamo, 30 specie, creando un design ingombrante 2 x 30. Tuttavia, puoi diventare abbastanza creativo con come modellare queste relazioni.

Ad esempio, alcuni ricercatori stanno sostenendo un uso ancora più ampio della modellazione multilivello. Gelman, Hill e Yajima (2012) sostengono che la modellazione multilivello potrebbe essere utilizzata come correzione per confronti multipli, anche nella ricerca sperimentale in cui la struttura dei dati non è ovviamente di natura gerarchica:

Problemi più difficili sorgono quando si modellano confronti multipli che hanno più struttura. Ad esempio, supponiamo di avere cinque misure di esito, tre varietà di trattamenti e sottogruppi classificati per due sessi e quattro gruppi razziali. Non vorremmo modellare questa struttura 2 × 3 × 4 × 5 come 120 gruppi intercambiabili. Anche in queste situazioni più complesse, pensiamo che la modellazione multilivello dovrebbe e finirà per sostituire le classiche procedure di confronto multiplo.

I problemi possono essere modellati in vari modi e, in casi ambigui, approcci multipli possono sembrare interessanti. Penso che il nostro compito sia scegliere un approccio ragionevole e informato e farlo in modo trasparente.


5

Ovviamente potresti costruire un modello per ogni gruppo diverso, non c'è niente di sbagliato in questo. Tuttavia, avresti bisogno di campioni di dimensioni maggiori e di gestire più modelli.

Utilizzando un modello misto, si raggruppano (e si condividono) i dati insieme e quindi si richiede una dimensione del campione inferiore.

Nel fare ciò, condividiamo la forza statistica. L'idea qui è che qualcosa che possiamo inferire bene in un gruppo di dati può aiutarci con qualcosa che non possiamo dedurre bene in un altro.

I modelli misti impediscono anche ai gruppi sovra-campionati di dominare ingiustamente l'inferenza.

Il punto è che se si desidera modellare la struttura gerarchica latern sottostante, è necessario aggiungere effetti casuali al modello. Altrimenti, se non ti interessa la tua interpretazione del modello, non la usi.

https://www.dropbox.com/s/rzi2rsou6h817zz/Datascience%20Presentation.pdf?dl=0

dà una discussione pertinente. L'autore ha discusso il motivo per cui non voleva eseguire modelli di regressione separati.

inserisci qui la descrizione dell'immagine


4

Nei modelli di effetti misti, aggiungi termini casuali (errore) al tuo modello, in modo da "mescolare" effetti fissi e casuali. Quindi, un altro approccio da considerare quando usare modelli di effetti misti, potrebbe essere quello di guardare che cos'è un "effetto casuale". Pertanto, oltre alle risposte precedentemente fornite, trovo anche la distinzione tra i termini "fisso" e "casuale" effetti di Bates (2010) istruttiva, sezione 1.1 (esp. Pagina 2).

I parametri associati ai livelli particolari di una covariata sono talvolta chiamati "effetti" dei livelli. Se l'insieme dei possibili livelli della covariata è fisso e riproducibile , modelliamo la covariata utilizzando parametri a effetti fissi. Se i livelli che abbiamo osservato rappresentano un campione casuale dall'insieme di tutti i livelli possibili , incorporiamo effetti casuali nel modello. Ci sono due cose da notare su questa distinzione tra parametri di effetti fissi ed effetti casuali. Innanzitutto, i nomi sono fuorvianti perché la distinzione tra fisso e casuale è più una proprietà dei livelli della covariata categorica che una proprietà degli effetti ad essi associati.

Questa definizione si applica spesso ad alcune strutture gerarchiche come i paesi o le aule, perché si dispone sempre di un campione "casuale" di paesi o aule: i dati non sono stati raccolti da tutti i paesi o le classi possibili.

Il sesso, tuttavia, è fisso (o almeno trattato come riparato). Se hai persone di sesso maschile o femminile, non sono rimasti altri livelli di sesso (potrebbero esserci alcune eccezioni di genere, ma questo è per lo più ignorato).

O dire livello di istruzione: se chiedi se le persone hanno un'istruzione inferiore, media o superiore, non sono rimasti livelli, quindi non hai preso un campione "casuale" di tutti i possibili livelli di istruzione (quindi, questo è un effetto fisso).


2
+1 Perché il voto negativo? È una citazione di uno statistico molto rispettato sulla modellazione di effetti casuali; il seguente commento è abbastanza diretto e ben definito ...
usεr11852,

3

Si utilizzano modelli misti quando si possono fare alcune ipotesi ragionevoli, basate sul disegno dello studio, sulla natura della correlazione tra osservazioni e inferenza a livello individuale o effetti condizionali . I modelli misti consentono specifiche di effetti casuali, che sono una rappresentazione conveniente delle strutture di correlazione che sorgono naturalmente nella raccolta dei dati.

Il tipo più comune di modello misto è un modello di intercettazioni casuali che stima una distribuzione latente di costanti comuni con una distribuzione normale di varianza finita media 0 all'interno di gruppi di individui identificati nel set di dati. Questo approccio rappresenta potenzialmente centinaia di fattori di confondimento comuni a gruppi di osservazioni o cluster, ma che variano tra i cluster.

Un secondo tipo comune di modello misto è un modello di pendenze casuali che, simile al modello di intercettazioni casuali, stima una distribuzione latente di interazioni tempo-predittore che di nuovo proviene da una distribuzione normale di varianza finita media 0 all'interno di uno studio di gruppo o cluster di osservazioni misurate in modo prospettico o longitudinale.

cor(Y1,Y2)=ρY1,Y2cor(Yt,YS)=ρ|t-S|Yt,YSt,Se 0 altrimenti. I risultati non sono identici, poiché l'intercettazione casuale impone che le osservazioni all'interno dei cluster siano associate in modo positivo, il che è quasi sempre un presupposto ragionevole.

Il livello individuale o gli effetti condizionati possono essere contrastati con il livello della popolazione o con effetti marginali. Gli effetti marginali rappresentano l'effetto in una popolazione di un intervento o di uno screening. Ad esempio, un intervento per aumentare la conformità nella riabilitazione dall'abuso di sostanze può considerare la presenza per più di 3 mesi in un gruppo di pazienti ammessi per varie condizioni. La durata dell'uso può variare tra i pazienti e prevedere con forza il rispetto del seminario con l'uso più prolungato di partecipanti con maggiori tendenze di dipendenza ed elusione. Un'analisi a livello individuale può rivelare che lo studio è efficace nonostante il fatto che i partecipanti con dipendenza più lunga non abbiano partecipato prima di ricevere l'intervento e abbiano continuato a non partecipare dopo aver ricevuto l'intervento.

Gli effetti marginali hanno deduzioni meno precise a causa dell'ignoranza dell'omogeneità tra i cluster nel tempo o nello spazio. Possono essere stimati con equazioni di stima generalizzate o emarginando i modelli misti.


2
+1, vorrei poter accettare 2 risposte !. il mio commento alla risposta di @ Mark si applica anche alla tua risposta. che mi hai aiutato a capire come definiamo "osservazione in gruppi"
Haitao Du,

2
@ hxd1011 Viene rigorosamente da una dichiarazione di progettazione dello studio. Qualsiasi progetto con campioni stratificati o misure ripetute avrà dati non indipendenti. Questo non è il caso di test statistici. La segnalazione o almeno l'ispezione degli effetti casuali può aiutare a comprendere l'estensione della correlazione, un ICC è un esempio di tale misura.
AdamO,

0

Gli effetti misti dovrebbero essere usati quando i dati hanno una struttura nidificata o gerarchica. Questo in realtà viola l'assunzione di indipendenza delle misurazioni, poiché tutte le misurazioni all'interno dello stesso gruppo / livello sono correlate. In caso di

"Se diversi gruppi / specie sono davvero simili. Di 'un cane femmina e un cane maschio. Penso che potremmo voler usare il genere come variabile categoriale nel modello."

il genere sarebbe un fattore variabile e un effetto fisso, mentre la variabilità delle dimensioni del cane all'interno del genere è un effetto casuale. Il mio modello sarebbe

response ~ sex + (1|size), data=data

Intuitivamente, il coniglio, il cane e il gatto dovrebbero essere modellati separatamente poiché le dimensioni di cane e gatto non sono correlate, tuttavia la dimensione di due cani è una specie di variabilità "all'interno della specie".


Personalmente ritengo che il termine "struttura nidificata o gerarchica" sia troppo generico e che sia difficile trovare dei limiti.
Haitao Du,

Forse hai ragione. Immagino quindi che gli LMM vengano utilizzati quando l'assunzione di IID viene violata a causa di una sorta di raggruppamento presente nei dati.
marianessa,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.