Interpretazione di tre forme di un "modello misto"


19

C'è una distinzione che mi fa inciampare con modelli misti, e mi chiedo se potrei avere un po 'di chiarezza su di esso. Supponiamo che tu abbia un modello misto di dati di conteggio. C'è una variabile che sai di voler come effetto fisso (A) e un'altra variabile per il tempo (T), raggruppata per dire una variabile "Sito".

A quanto ho capito:

glmer(counts ~ A + T, data=data, family="Poisson") è un modello a effetti fissi.

glmer(counts ~ (A + T | Site), data=data, family="Poisson") è un modello a effetto casuale.

La mia domanda è quando hai qualcosa come:

glmer(counts ~ A + T + (T | Site), data=data, family="Poisson")che cos'è T? È un effetto casuale? Un effetto fisso? Cosa si sta realizzando mettendo T in entrambi i posti?

Quando dovrebbe apparire qualcosa solo nella sezione degli effetti casuali della formula del modello?

Risposte:


22

Ciò può diventare più chiaro scrivendo la formula del modello per ciascuno di questi tre modelli. Lasciate sia l'osservazione per persona ho in sito j in ogni modello e definire un i j , T i j analogamente a fare riferimento alle variabili nel modello.YijijAij,Tij

glmer(counts ~ A + T, data=data, family="Poisson") è il modello

log(E(Yij))=β0+β1Aij+β2Tij

che è solo un normale modello di regressione del poisson.

glmer(counts ~ (A + T|Site), data=data, family="Poisson") è il modello

log(E(Yij))=α0+ηj0+ηj1Aij+ηj2Tij

dove sono effetti casuali che sono condivisi da ciascuna osservazione fatta dagli individui dal sito j . Questi effetti casuali possono essere liberamente correlati (ovvero non vengono applicate restrizioni su Σ ) nel modello specificato. Per imporre l'indipendenza, è necessario posizionarli tra parentesi diverse, ad es. Lo farebbe. Questo modello presuppone quel registro ( E ( Y i jηj=(ηj0,ηj1,ηj2)~N(0,Σ)jΣ(A-1|Site) + (T-1|Site) + (1|Site) è α 0 per tutti i siti ma ogni sito ha un offset casuale ( η j 0log(E(Yioj))α0ηj0 ) e ha una relazione lineare casuale con .Aij,Tij

glmer(counts ~ A + T + (T|Site), data=data, family="Poisson") è il modello

log(E(Yij))=(θ0+γj0)+θ1Aij+(θ2+γj1)Tij

Quindi ora ha una relazione "media" con A i j , T i j , data dagli effetti fissi θ 0 , θ 1 , θ 2 ma quella relazione è diversa per ogni sito e quelle differenze sono catturati dagli effetti casuali, γ j 0 , γ j 1 , γ j 2log(E(Yij))Aij,Tijθ0,θ1,θ2γj0,γj1,γj2. Cioè, la linea di base viene spostata in modo casuale e le pendenze delle due variabili vengono spostate in modo casuale e tutti dallo stesso sito condividono lo stesso spostamento casuale.

che cos'è T? È un effetto casuale? Un effetto fisso? Cosa si sta realizzando mettendo T in entrambi i posti?

TSiteTSiteγj1Tlog(E(Yij))

Quando dovrebbe apparire qualcosa solo nella sezione degli effetti casuali della formula del modello?

Questa è una questione di ciò che ha senso nel contesto dell'applicazione.

γj0

log(E(Yij))TSite

Nota che puoi adattare il modello con e senza effetti casuali per vedere se ciò sta accadendo: non dovresti vedere alcun effetto nel modello fisso ma significativi effetti casuali nel modello successivo. Devo avvertirti che decisioni come questa sono spesso prese meglio sulla base della comprensione dell'applicazione piuttosto che attraverso la selezione del modello.


2
(+1): scrivere la formula del modello per ciascun modello è davvero il modo migliore per rendere le notazioni R più trasparenti; buon lavoro!
Ocram,

@Macro Una domanda sulle equazioni sopra (grazie per loro tra l'altro) - hanno anche il solito termine di errore in esse? In tal caso, qual è la sottoscrizione di quel termine?
Fomite

2
E(Yij|X)Yij|X . La casualità "rimanente" in un modello lineare si manifesta con un termine di errore normalmente distribuito. Ma nei GLM non lineari (es. Poisson, logistica) c'è casualità "incorporata" poiché conoscere il tasso di un poisson o una probabilità di successo di una prova di bernoulli non consente di prevedere una realizzazione senza errori. Spero che sia di aiuto.

11

Dovresti notare che Tnessuno dei termini del tuo modello è un effetto casuale, ma un effetto fisso. Gli effetti casuali sono solo quegli effetti che compaiono dopo il| in una lmerformula!

Una discussione più approfondita di ciò che questa specifica può trovare in questo domanda su domande frequenti .

Da queste domande il tuo modello dovrebbe fornire quanto segue (per il tuo effetto fisso T ):

  • Una pendenza globale
  • Un termine di pendenze casuali che specifica la deviazione dalla pendenza complessiva per ciascun livello di Site
  • La correlazione tra le pendenze casuali.

E come detto da @ mark999 questa è davvero una specifica comune. Nei progetti di misure ripetute, in genere si desidera avere pendenze e correlazioni casuali per tutti i fattori di misure ripetute (entro soggetti).

Vedi il seguente documento per alcuni esempi (che tendo a citare sempre qui):

Judd, CM, Westfall, J., & Kenny, DA (2012). Trattare gli stimoli come un fattore casuale nella psicologia sociale: una nuova e completa soluzione a un problema pervasivo ma ampiamente ignorato. Journal of Personality and Social Psychology , 103 (1), 54–69. doi: 10,1037 / a0028347


2
Un riferimento simile dall'ecologia: Schielzeth, Holger e Wolfgang Forstmeier. 2009. "Conclusioni oltre il supporto: stime troppo sicure in modelli misti." Ecologia comportamentale 20 (2) (1 marzo): 416–420. DOI: 10.1093 / beheco / arn145. beheco.oxfordjournals.org/content/20/2/416 .
Ben Bolker,

1

Qualcosa dovrebbe apparire solo nella parte casuale quando non sei particolarmente interessato al suo parametro, di per sé, ma devi includerlo per evitare dati dipendenti. Ad esempio, se i bambini sono nidificati in classe, di solito li desideri solo come effetto casuale.


1
Forse ti fraintendo, ma avrei pensato che avere effetti fissi e casuali per la stessa variabile fosse più comune di una variabile che avesse solo un effetto casuale. Avere effetti fissi e casuali per la stessa variabile non è raro nel libro Pinheiro e Bates.
mark999

2
@MichaelChernick come ho capito, se hai un effetto fisso e un effetto casuale per la stessa variabile, l'effetto fisso è l'effetto complessivo nella popolazione, mentre l'effetto casuale consente un effetto diverso della variabile per ogni soggetto. Ci sono diversi esempi in Pinheiro e Bates.
mark999,

2
@PeterFlom, re: "se i bambini sono nidificati nelle classi, di solito li vuoi solo come effetto casuale." Penso che intendi dire che la classe è l'effetto casuale. A meno che non vi sia un'ulteriore nidificazione nei dati (ad esempio misurazioni ripetute sui bambini), gli effetti casuali a livello di bambino non vengono identificati.
Macro

1
@macro Sì, è quello che volevo dire, scusa. La terminologia diventa molto confusa! Questo potrebbe essere il motivo per cui Gelman evita i termini "fisso" e "casuale"
Peter Flom - Ripristina Monica

2
@Michael, sono d'accordo con te. In questi tipi di modelli gerarchici, gli effetti casuali sono definiti da una variabile di raggruppamento (al contrario di altri modelli multivariati come insiemi di dati indicizzati spazialmente, in cui la variabile di "raggruppamento" varia continuamente). Nella domanda del PO, Sitesarebbe indicato come effetto casuale, non To Ao altro. Pensandolo in questo modo, Sitel'effetto chiaramente non poteva essere sia fisso che casuale, poiché i due non sarebbero stati identificati l'uno dall'altro. Puoi avere coefficienti sia fissi che casuali per una variabile, ma questa è una domanda diversa.
Macro
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.