Contesto
Questa domanda utilizza R, ma riguarda questioni statistiche generali.
Sto analizzando gli effetti dei fattori di mortalità (percentuale di mortalità dovuta a malattia e parassitismo) sul tasso di crescita della popolazione delle falene nel tempo, in cui le popolazioni larvali sono state campionate da 12 siti una volta all'anno per 8 anni. I dati sul tasso di crescita della popolazione mostrano una tendenza ciclica chiara ma irregolare nel tempo.
I residui di un semplice modello lineare generalizzato (tasso di crescita ~% malattia +% parassitismo + anno) hanno mostrato una tendenza ciclica altrettanto chiara ma irregolare nel tempo. Pertanto, i modelli dei minimi quadrati generalizzati della stessa forma sono stati anche adattati ai dati con strutture di correlazione appropriate per gestire l'autocorrelazione temporale, ad esempio simmetria composta, ordine di processo autoregressivo 1 e strutture di correlazione media mobile autoregressiva.
Tutti i modelli contenevano gli stessi effetti fissi, sono stati confrontati usando AIC e sono stati montati da REML (per consentire il confronto di diverse strutture di correlazione da AIC). Sto usando il pacchetto R nlme e la funzione gls.
Domanda 1
I residui dei modelli GLS mostrano ancora schemi ciclici quasi identici se tracciati contro il tempo. Tali schemi rimarranno sempre, anche nei modelli che tengono conto in modo accurato della struttura di autocorrelazione?
Ho simulato alcuni dati semplificati ma simili in R sotto la mia seconda domanda, che mostra il problema in base alla mia attuale comprensione dei metodi necessari per valutare i modelli temporizzati autocorrelati nei residui del modello , che ora so che sono sbagliati (vedi risposta).
Domanda 2
Ho adattato i miei modelli GLS con tutte le possibili strutture di correlazione plausibili ai miei dati, ma nessuno è in realtà sostanzialmente più adatto del GLM senza alcuna struttura di correlazione: solo un modello GLS è leggermente migliore (punteggio AIC = 1,8 inferiore), mentre tutto il resto ha valori AIC più alti. Tuttavia, questo è solo il caso in cui tutti i modelli sono montati da REML, non ML dove i modelli GLS sono chiaramente molto migliori, ma ho capito dai libri di statistica che devi solo usare REML per confrontare i modelli con diverse strutture di correlazione e gli stessi effetti fissi per motivi Non dettaglia qui.
Data la natura chiaramente correlata temporalmente dei dati, se nessun modello è anche moderatamente migliore del semplice GLM qual è il modo più appropriato per decidere quale modello utilizzare per l'inferenza, supponendo che sto usando un metodo appropriato (eventualmente voglio usare AIC per confrontare diverse combinazioni di variabili)?
Q1 'simulazione' che esplora modelli residui in modelli con e senza strutture di correlazione appropriate
Genera una variabile di risposta simulata con un effetto ciclico di "tempo" e un effetto lineare positivo di "x":
time <- 1:50
x <- sample(rep(1:25,each=2),50)
y <- rnorm(50,5,5) + (5 + 15*sin(2*pi*time/25)) + (x/1)
y dovrebbe mostrare una tendenza ciclica nel 'tempo' con variazione casuale:
plot(time,y)
E una relazione lineare positiva con 'x' con variazione casuale:
plot(x,y)
Crea un semplice modello additivo lineare di "y ~ time + x":
require(nlme)
m1 <- gls(y ~ time + x, method="REML")
Il modello mostra chiari schemi ciclici nei residui quando tracciati contro il 'tempo', come ci si aspetterebbe:
plot(time, m1$residuals)
E quale dovrebbe essere una bella, chiara mancanza di qualsiasi modello o tendenza nei residui quando tracciata contro 'x':
plot(x, m1$residuals)
Un semplice modello di "y ~ time + x" che include una struttura di correlazione autoregressiva dell'ordine 1 dovrebbe adattarsi molto meglio ai dati rispetto al modello precedente a causa della struttura di autocorrelazione, quando valutato utilizzando AIC:
m2 <- gls(y ~ time + x, correlation = corAR1(form=~time), method="REML")
AIC(m1,m2)
Tuttavia, il modello dovrebbe comunque mostrare residui autocorrelati quasi identici 'temporalmente':
plot(time, m2$residuals)
Grazie mille per qualsiasi consiglio.