Ho specificato correttamente il mio modello in lmer?


26

Ho analizzato molti siti di aiuto e sono ancora confuso su come specificare termini nidificati più complicati anche in un modello misto. Sono anche confuso come l'uso di :e /e |nello specificare le interazioni e la nidificazione con fattori casuali utilizzando lmer()nel lme4pacchetto in R.

Ai fini di questa domanda, supponiamo di aver accuratamente rappresentato i miei dati con questo modello statistico standard: è fisso e sono casuali. è (implicitamente) nidificato all'interno .

Yijk=u+stationi+towj(i)+dayk+(station×day)ik+(tow×day)j(i)k
stationtowdayTowstation

In altre parole, spero che il mio modello includa Station (i, fixed), Tow (j, random, nidificato implicitamente all'interno di Station), Day (k, random) e interazione tra Tow e Day e l'interazione tra Day e stazione. Ho consultato uno statistico per creare il mio modello e in questo momento ritengo che sia rappresentativo dei miei dati, ma aggiungerò anche una descrizione dei miei dati per coloro che sono interessati alla fine del mio post in modo da non ingombrare.

Finora ciò che sono stato in grado di mettere insieme è il seguente in lmer:

lmer(y ~ station + (1|station:tow) + (1|Day) + (1|station:day) + (1|tow:day), 
     data=my.data)

Questo rappresenta accuratamente il mio modello statistico? Qualche suggerimento su come migliorare il mio codice se non viene letto correttamente?

Ho messo in grassetto i termini specifici che ho difficoltà a specificare nella mia formula lmer

# 1. rimorchio nidificato all'interno della stazione quando il rimorchio è casuale e la stazione è fissa,
sono confuso, tuttavia riguardo alla differenziazione tra termini nidificati e termini di interazione che sono casuali usando :e /. Nel mio esempio sopra, ho (1|station:tow)in cui spero che legga il trailer nidificato all'interno della stazione. Ho letto commenti contrastanti su vari siti indipendentemente dal fatto che dovrei utilizzare :o /qui nel (1|...)formato casuale di lmer.

# 2. L'interazione tra la stazione e il giorno in cui la stazione è fisso e il giorno è casuale
Allora ho (1|station:day), ma questa volta spero si legge l'interazione tra la stazione e il giorno. Sembra che potrei usare station * day per tenere conto dei singoli effetti di station e day e della loro interazione (piuttosto che includere ciascuno dei tre termini separatamente come faccio sopra), ma non vedo come specificarlo quando uno è fisso e l'altro è casuale. Lo farebbe station*(1|day)?

# 3. L'interazione tra rimorchio e giorno (entrambi casuali) quando il rimorchio è nidificato nella stazione (fisso) Quindi, infine, ho quello (1|tow:day)che spero legge l'interazione di towe day, ma mi chiedo se devo specificare di nuovo che il rimorchio è nidificato (implicitamente) in stazione?

Sono una novità sia Rper la lmermodellazione statistica che per quella statistica e apprezzo molto il problema delle spiegazioni approfondite in qualsiasi risposta alle mie domande, se possibile.

Maggiori dettagli sui miei dati: chiedo se le concentrazioni di plancton variano in un fronte fisico nell'oceano vicino alla costa. Ho tre stazioni, a terra, all'interno e al largo di questo fronte. La stazione è quindi fissa. Ad ogni stazione prendo tre rimorchi di plancton replicati (da cui seleziono, conto e ottengo una concentrazione in termini di # di bug per metro cubo di acqua). Il rimorchio è casuale: in tre rimorchi spero di rendere conto della variabilità generale del plancton in quella particolare stazione. Il rimorchio è intrinsecamente nidificato nella stazione poiché ogni rimorchio non ha un ID univoco (123.123.123 è l'ID per i rimorchi in ciascuna stazione). Ho quindi fatto questo in più giorni indipendenti con un nuovo fronte che si era formato. Penso di poter pensare al Day come a un fattore di blocco? Il giorno è casuale poiché ripetere questo in più giorni di fronte indipendenti sta tentando di catturare la variabilità di giorno in giorno ed essere rappresentativo di tutti i giorni in cui questo fronte è presente. Voglio sapere i termini di interazione per vedere se Tows cambia nella variabilità di giorno in giorno e se le stazioni producono sempre dati simili o dipende dal giorno?

Ancora una volta, grazie per il tuo tempo e aiuto, lo apprezzo!


Credo che manchi alcuni pedici (non volevo aggiungerli se mi sbagliavo) nel tuo modello statistico standard.

1
FWIW, per chiunque si imbatta in questa discussione e si chieda se sia in tema, data la sua attenzione sulla Rsintassi, IMO, è sufficientemente statistico (comprensione scritta come il modello specificato si riferisce a nidificazione e interazioni, ecc.) Per essere in tema per CV.
gung - Ripristina Monica

1
Questo è al 100% sull'argomento secondo me.


2
Secondo la tua lmer()sintassi, hai specificato un modello in cui vi è un effetto fisso di statione quattro intercettazioni casuali, condivise da individui con la stessa (1) combinazione di statione tow, (2) valore di Day, (3) combinazione di statione daye ( 4) combinazione di towe day, rispettivamente. È questo che intendevi? Non sono sicuro perché, come indicato da @BabekP, il modo in cui hai scritto la tua formulazione del modello non è chiaro. Hai scritto nomi di variabili, non parametri. Normalmente, in un modello come questo, le combinazioni di variabili vengono catturate dai pedici.
Macro

Risposte:


23

Rimorchio annidato all'interno della stazione quando il rimorchio è casuale e la stazione è fissa

station+(1|station:tow)è corretta. Come ha detto @John nella sua risposta, (1|station/tow)si espanderebbe a (1|station)+(1|station:tow)(effetto principale della stazione più interazione tra rimorchio e stazione), cosa che non si desidera perché hai già specificato la stazione come effetto fisso.

Interazione tra stazione e giorno quando la stazione è fissa e il giorno è casuale.

L'interazione tra un effetto fisso e uno casuale è sempre casuale. Ancora una volta, come ha detto @John, si station*dayespande station+day+station:day, cosa che (di nuovo) non vuoi perché hai già specificato daynel tuo modello. Non penso che ci sia un modo per fare ciò che vuoi e comprimere gli effetti incrociati di day(random) e station(fixed), ma potresti volerlo scrivere station+(1|day/station), che come specificato nella risposta precedente si espanderebbe a station + (1|day) + (1|day:station).

interazione tra rimorchio e giorno in cui il rimorchio è annidato nella stazione

Perché non si dispone di valori unici della towvariabile (cioè perché, come si dice qui di seguito risalita sono specificate come 1, 2, 3ad ogni stazione, si fa necessità di specificare la nidificazione, come (1|station:tow:day). Se si ha avuto la risalita specificate in modo univoco, è possibile utilizzare sia (1|tow:day)oppure (1|station:tow:day)(dovrebbero fornire risposte equivalenti). Se in questo caso non si specifica l'annidamento, lme4si tenterà di stimare un effetto casuale condiviso dal rimorchio n. 1 in tutte le stazioni ...

station:tow:day××

Sono http://bbolker.github.io/mixedmodels-misc/glmmFAQ.html#model-specification e http://bbolker.github.io/mixedmodels-misc/glmmFAQ.html#nested-or-crossed utile a voi?


grazie mille per l'utile risposta e riferimenti, sono molto apprezzati. Sono confuso riguardo alla notazione (1 | a: b) mentre descrivi sopra, dove sembra che ':' possa significare "nidificato in" così come un'interazione. Come può specificare entrambi? In altre parole, come fa Lmer a sapere quale relazione stai indicando? Mi manca qualcosa di semplice qui, mi scuso.
mercoledì

4
Non c'è molta differenza, in questo contesto, tra interazione e nidificazione. Il fatto che Bsia nidificato Ao interagisca semplicemente con esso dipende dal fatto che l'effetto principale Asia incluso o meno nel modello. Se l'effetto principale di Bè anche nel modello, allora è attraversato ...
Ben Bolker,

Ciao a tutti, ho fatto una domanda correlata qui: stats.stackexchange.com/questions/272377/… se qualcuno (specialmente @BenBolker) ha la possibilità di cercare e fornire una risposta.
Joshua Rosenberg,

11

Alcune delle cose in formula sono un po 'confuse. Il :è per le interazioni tra due termini, mentre la *è per gli effetti principali e le interazioni. Questo /è un altro per le interazioni, ma ciò che fa è generare un'interazione tra il numeratore e tutti i termini nel denominatore (ad es A/(B+C) = A:B + A:C.). Il |è per qualcosa come "raggruppati per". Quindi, 1|stationsarebbe intercettato raggruppato per stazione e tra parentesi è casuale (1|station). È così che faresti la nidificazione.

Spero che sia di aiuto. È un po 'strano avere un effetto casuale annidato all'interno di un effetto fisso e non sono sicuro di come lo rappresenteresti. Non riesco nemmeno a immaginare la situazione. Potresti ottenere una risposta migliore se spieghi solo quali sono le tue variabili e cosa vuoi realizzare. Molte volte le persone fanno domande e usano la terminologia sbagliata ed è difficile comunicare. Spiega cosa rappresentano le variabili e cosa vuoi sapere su di esse.

Concentrandoti sulla tua descrizione nell'ultimo paragrafo sembra che il tuo rimorchio sia semplicemente un indicatore dei campioni che hai raccolto e non qualcosa di cui hai bisogno di stime, nel senso che ti aspetti che il rimorchio 1 sia in qualche modo diverso dal rimorchio 2 in qualche modo. Tow sta semplicemente indicando un campione. A meno che tu non creda davvero che l'ordine dei rimorchi sia importante, non ti preoccupi nemmeno di quella variabile. E se hanno importanza, allora è un effetto fisso (e forse casuale, ma non un effetto esclusivamente casuale). Dici che vuoi sapere se i rimorchi cambiano di variabilità di giorno in giorno. Che ne dici della risposta è sì? Non è nel regno della probabilità realistica che non variano di giorno in giorno. È solo la varianza delle tue misure. Tu' non ti è permesso provare a tenere conto di ogni specifica di varianza perché poi finisci per non avere alcuna varianza lasciata per errore. Avresti un modello sopra specificato. Saresti al punto di riportare ogni misura.

Fai una dichiarazione simile riguardo a chiederti se la stazione varia di giorno in giorno; certo che lo fa. Ma forse vuoi dire giorni specifici? I giorni sono stati raggruppati in qualche modo per stagione, ciclo lunare, ecc.? A meno che tu non abbia qualcosa di diverso da questo, è il giorno 1, questo è il giorno 2, ecc. In che modo sapere che le stazioni variano di giorno in giorno ti dice qualcosa di diverso dalle stazioni? Quindi la risposta a questa domanda è, ovviamente le stazioni variano di giorno in giorno. E naturalmente i rimorchi variano di giorno in giorno e da stazione a stazione. Finisci a sinistra con un modello semplice:

aov(y ~ station, data = dat)

L'unico effetto fisso che hai qui, stazione, viene semplicemente campionato su più rimorchi e più giorni. Non sono sicuro che tu abbia davvero bisogno della modellazione multilivello qui. Sembra che tu stia specificando troppo il tuo modello.

Se vuoi davvero effetti casuali di giorno e di rimorchio e ci sono informazioni che non hai specificato qui, potresti espanderle in un modello multi-livello. Sarebbe:

lmer(y ~ station + (two*day|station), data = dat)

Tuttavia, per utilizzare quel modello sono necessari più rimorchi per ogni stazione e giorno.


Sono d'accordo con tutto ciò che hai detto, ma penso che questo sia probabilmente più un commento che una risposta.
Macro

@Giovanni ero con te fino a quando "è così che faresti il ​​nido". Penso di aver perso il punto reale di come si fa il nido. Saresti disposto a spiegare in modo più dettagliato? Penso di essere ancora confuso dal | e ne esamineremo di più. Ma dalla tua risposta, non sono ancora sicuro di come, ad esempio, indicare che il rimorchio (casuale) è nidificato all'interno della stazione (fisso)?
mercoledì

@ John Oh e la stazione è fissa come siti / posizioni di interesse nell'oceano e il rimorchio è casuale perché sto prendendo rimorchi di plancton in questi siti che sono casuali in quanto stanno cercando di spiegare la variabilità del plancton in ciascun sito e quindi essere estrapolati per rappresentare la popolazione di plancton in una stazione.
mercoledì

1
Non ogni etichetta di un campione è una variabile casuale, vedi le modifiche.
Giovanni,

1
Penso ancora che il rimorchio non dovrebbe essere nel modello dato quella descrizione. La giornata suona bene però.
Giovanni,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.