Ho analizzato molti siti di aiuto e sono ancora confuso su come specificare termini nidificati più complicati anche in un modello misto. Sono anche confuso come l'uso di :
e /
e |
nello specificare le interazioni e la nidificazione con fattori casuali utilizzando lmer()
nel lme4
pacchetto in R
.
Ai fini di questa domanda, supponiamo di aver accuratamente rappresentato i miei dati con questo modello statistico standard: è fisso e sono casuali. è (implicitamente) nidificato all'interno .
station
tow
day
Tow
station
In altre parole, spero che il mio modello includa Station (i, fixed), Tow (j, random, nidificato implicitamente all'interno di Station), Day (k, random) e interazione tra Tow e Day e l'interazione tra Day e stazione. Ho consultato uno statistico per creare il mio modello e in questo momento ritengo che sia rappresentativo dei miei dati, ma aggiungerò anche una descrizione dei miei dati per coloro che sono interessati alla fine del mio post in modo da non ingombrare.
Finora ciò che sono stato in grado di mettere insieme è il seguente in lmer
:
lmer(y ~ station + (1|station:tow) + (1|Day) + (1|station:day) + (1|tow:day),
data=my.data)
Questo rappresenta accuratamente il mio modello statistico? Qualche suggerimento su come migliorare il mio codice se non viene letto correttamente?
Ho messo in grassetto i termini specifici che ho difficoltà a specificare nella mia formula lmer
# 1. rimorchio nidificato all'interno della stazione quando il rimorchio è casuale e la stazione è fissa,
sono confuso, tuttavia riguardo alla differenziazione tra termini nidificati e termini di interazione che sono casuali usando :
e /
. Nel mio esempio sopra, ho (1|station:tow)
in cui spero che legga il trailer nidificato all'interno della stazione. Ho letto commenti contrastanti su vari siti indipendentemente dal fatto che dovrei utilizzare :
o /
qui nel (1|...)
formato casuale di lmer
.
# 2. L'interazione tra la stazione e il giorno in cui la stazione è fisso e il giorno è casuale
Allora ho (1|station:day)
, ma questa volta spero si legge l'interazione tra la stazione e il giorno. Sembra che potrei usare station * day per tenere conto dei singoli effetti di station e day e della loro interazione (piuttosto che includere ciascuno dei tre termini separatamente come faccio sopra), ma non vedo come specificarlo quando uno è fisso e l'altro è casuale. Lo farebbe station*(1|day)
?
# 3. L'interazione tra rimorchio e giorno (entrambi casuali) quando il rimorchio è nidificato nella stazione (fisso)
Quindi, infine, ho quello (1|tow:day)
che spero legge l'interazione di tow
e day
, ma mi chiedo se devo specificare di nuovo che il rimorchio è nidificato (implicitamente) in stazione?
Sono una novità sia R
per la lmer
modellazione statistica che per quella statistica e apprezzo molto il problema delle spiegazioni approfondite in qualsiasi risposta alle mie domande, se possibile.
Maggiori dettagli sui miei dati: chiedo se le concentrazioni di plancton variano in un fronte fisico nell'oceano vicino alla costa. Ho tre stazioni, a terra, all'interno e al largo di questo fronte. La stazione è quindi fissa. Ad ogni stazione prendo tre rimorchi di plancton replicati (da cui seleziono, conto e ottengo una concentrazione in termini di # di bug per metro cubo di acqua). Il rimorchio è casuale: in tre rimorchi spero di rendere conto della variabilità generale del plancton in quella particolare stazione. Il rimorchio è intrinsecamente nidificato nella stazione poiché ogni rimorchio non ha un ID univoco (123.123.123 è l'ID per i rimorchi in ciascuna stazione). Ho quindi fatto questo in più giorni indipendenti con un nuovo fronte che si era formato. Penso di poter pensare al Day come a un fattore di blocco? Il giorno è casuale poiché ripetere questo in più giorni di fronte indipendenti sta tentando di catturare la variabilità di giorno in giorno ed essere rappresentativo di tutti i giorni in cui questo fronte è presente. Voglio sapere i termini di interazione per vedere se Tows cambia nella variabilità di giorno in giorno e se le stazioni producono sempre dati simili o dipende dal giorno?
Ancora una volta, grazie per il tuo tempo e aiuto, lo apprezzo!
R
sintassi, IMO, è sufficientemente statistico (comprensione scritta come il modello specificato si riferisce a nidificazione e interazioni, ecc.) Per essere in tema per CV.
lmer()
sintassi, hai specificato un modello in cui vi è un effetto fisso di station
e quattro intercettazioni casuali, condivise da individui con la stessa (1) combinazione di station
e tow
, (2) valore di Day
, (3) combinazione di station
e day
e ( 4) combinazione di tow
e day
, rispettivamente. È questo che intendevi? Non sono sicuro perché, come indicato da @BabekP, il modo in cui hai scritto la tua formulazione del modello non è chiaro. Hai scritto nomi di variabili, non parametri. Normalmente, in un modello come questo, le combinazioni di variabili vengono catturate dai pedici.