Quando includere un effetto casuale in un modello


9

Sono nuovo nel modellismo misto e sono confuso sul fatto che sia appropriato usare un effetto casuale in un'analisi che sto facendo. Tutto il consiglio sarebbe apprezzato.

il mio studio sta testando quanto un indice recentemente sviluppato dell'abbondanza di mammiferi possa prevedere il valore di un indice stabilito ma più laborioso. ho misurato questi indici in più patch forestali, con più grafici in ogni patch forestale.

poiché non sono direttamente interessato all'effetto delle patch forestali e poiché i miei grafici di esempio sono nidificati all'interno delle patch forestali, sto usando la patch forestale come effetto casuale. Tuttavia, ho un paio di domande su questo:

in primo luogo, so che gli effetti casuali ti consentono di generalizzare i tuoi risultati su tutti i possibili livelli del fattore casuale, non solo quelli che hai campionato. ma mi sembra che per fare questo tipo di inferenza i tuoi livelli debbano essere campionati casualmente? Le patch della mia foresta non sono state campionate casualmente, quindi posso ancora usarle come effetto casuale?

secondo, ho letto che puoi verificare se è necessario avere un effetto casuale facendo ad esempio un test del rapporto di verosimiglianza per confrontare i modelli con e senza l'effetto. Ho fatto questo, e suggerisce che il modello a effetti casuali non spiega i dati e un modello a effetti fissi. il mio problema con questo è che i miei grafici sono ancora nidificati all'interno di patch forestali e quindi presumibilmente non indipendenti. quindi, posso usare questo approccio LRT per giustificare l'esclusione dell'effetto casuale o devo ancora includerlo per tenere conto del nidificazione? e se finisco per rimuovere l'effetto casuale, c'è un modo per verificare che i grafici all'interno delle patch della foresta possano essere considerati indipendenti?

Grazie per l'aiuto!

ghiandaia


Penso che la cosa concettuale principale con effetti casuali sia che dovrebbero essere tutti della stessa grandezza ed essere scambiabili - questo è ciò che rende possibile l'inferenza sugli effetti casuali non campionati. Inoltre, dovresti fare attenzione usando i test LR per effetti casuali in quanto potrebbe esserci una notevole incertezza riguardo alla componente di varianza anche se la stima ML / REML è zero o vicina allo zero.
Probislogic,

Grazie mille per quello. Quindi ci sarebbe un modo per capire se fosse necessario mantenere l'effetto casuale?
jay

Da quello che ho capito, è meglio non fare confronti LR con modelli adatti a REML. In R lmer, ad esempio, dovresti impostare REML = FALSE quando esegui LRT. (L'impostazione predefinita è VERO, che è altrimenti migliore.)
Wayne,

Risposte:


6

A quanto ho capito, hai un semplice disegno osservativo nidificato (grafici all'interno di patch) e il tuo interesse è in una correlazione / regressione tra due variabili continue (i due indici). La dimensione del campione è m patch xn grafici = N coppie di osservazioni (o il sommario appropriato se sbilanciato). Non è stata coinvolta alcuna randomizzazione corretta, ma forse puoi / dovresti / vuoi considerare che (1) le patch sono state "casualmente" selezionate da tutte le patch di questo tipo o in qualche area, e quindi (2) le trame sono state "casualmente" selezionato all'interno di ogni patch.

Se ignori la Patch del fattore casuale, potresti essere pseudoreplicante considerando che hai selezionato casualmente N grafici "liberamente", senza vincolarli ad essere (in numero o tipo) in quelle (precedentemente) patch selezionate.

Quindi, la tua prima domanda: sì, questo è ciò che consente un fattore casuale. La validità di tale inferenza dipende dalla validità dell'ipotesi che la selezione casuale sia equivalente alla selezione casuale di patch (ad esempio, che i risultati non sarebbero diversi se fosse selezionato un diverso set di patch forestali). Ciò pone un limite anche al tuo spazio di inferenza: il tipo di foresta o area geografica in cui si estendono i risultati dipende dalla popolazione massima (immaginaria) di patch da cui il campione è un campione "casuale" credibile. Forse le tue osservazioni sono un campione "ragionevolmente casuale" dei mammiferi delle aree forestali nella tua regione, ma sarebbero un campione sospettosamente aggregato dei mammiferi dell'intero continente.

Il secondo: il test dipenderà dal "grado di pseudoreplicazione" o dalle prove nel campione che le trame "appartengono" alle patch. Questa è la quantità di variazione tra le patch e tra le trame all'interno delle patch (ricerca della correlazione intraclasse). In estrema misura, è presente solo la variazione tra le patch (i grafici all'interno di una patch sono tutti uguali) e si ha "pura pseudoreplicazione": la tua N dovrebbe essere il numero di patch e campionare una o più trame da ciascuna di esse non fornisce nuova informazione. All'altro estremo, tutte le variazioni si verificano tra i grafici e non vi è alcuna variazione aggiuntiva spiegata sapendo a quale patch della foresta appartiene ogni grafico (e quindi il modello senza il fattore casuale sembrerebbe più parsimonioso); hai trame "indipendenti". NESSUNO degli estremi è molto probabile che accada ... in particolare per le variabili biologiche osservate sul terreno, se non altro a causa dell'autocorrelazione spaziale e delle distribuzioni geografiche dei mammiferi. Personalmente preferisco mantenere i fattori in base alla progettazione (ad esempio, anche quando le patch non sono una fonte rilevante di variazione IN QUESTO CAMPIONE) per sostenere l'analogia "sperimentale-osservativa" spiegata sopra; Ricorda: non avere prove nel tuo campione per rifiutare l'ipotesi nulla che la variazione tra le patch sia zero non significa che la variazione sia zero nella popolazione. anche quando le patch non sono una fonte rilevante di variazione IN QUESTO CAMPIONE) per sostenere l'analogia "sperimentale-osservazionale" spiegata sopra; Ricorda: non avere prove nel tuo campione per rifiutare l'ipotesi nulla che la variazione tra le patch sia zero non significa che la variazione sia zero nella popolazione. anche quando le patch non sono una fonte rilevante di variazione IN QUESTO CAMPIONE) per sostenere l'analogia "sperimentale-osservazionale" spiegata sopra; Ricorda: non avere prove nel tuo campione per rifiutare l'ipotesi nulla che la variazione tra le patch sia zero non significa che la variazione sia zero nella popolazione.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.