Interpretazione della varianza dell'effetto casuale in glmer


13

Sto rivedendo un articolo sull'impollinazione, in cui i dati sono distribuiti binomialmente (il frutto matura o no). Quindi ho usato glmercon un effetto casuale (singola pianta) e un effetto fisso (trattamento). Un revisore vuole sapere se la pianta ha avuto un effetto sull'allegagione, ma ho difficoltà a interpretare i glmerrisultati.

Ho letto sul Web e sembra che ci possano essere problemi con il confronto diretto glme i glmermodelli, quindi non lo sto facendo. Ho pensato che il modo più semplice per rispondere alla domanda sarebbe di confrontare la varianza dell'effetto casuale (1.449, sotto) con la varianza totale, o la varianza spiegata dal trattamento. Ma come posso calcolare queste altre variazioni? Non sembrano essere inclusi nell'output di seguito. Ho letto qualcosa sulle varianze residue che non sono state incluse per il binomio glmer: come posso interpretare l'importanza relativa dell'effetto casuale?

> summary(exclusionM_stem)
Generalized linear mixed model fit by maximum likelihood (Laplace
  Approximation) [glmerMod]
 Family: binomial  ( logit )
Formula: cbind(Fruit_1, Fruit_0) ~ Treatment + (1 | PlantID)

     AIC      BIC   logLik deviance df.resid 
   125.9    131.5    -59.0    117.9       26 

Scaled residuals: 
    Min      1Q  Median      3Q     Max 
-2.0793 -0.8021 -0.0603  0.6544  1.9216 

Random effects:
 Groups  Name        Variance Std.Dev.
 PlantID (Intercept) 1.449    1.204   
Number of obs: 30, groups:  PlantID, 10

Fixed effects:
            Estimate Std. Error z value Pr(>|z|)   
(Intercept)  -0.5480     0.4623  -1.185   0.2359   
TreatmentD   -1.1838     0.3811  -3.106   0.0019 **
TreatmentN   -0.3555     0.3313  -1.073   0.2832   
---
Signif. codes:  0***0.001**0.01*0.05 ‘.’ 0.1 ‘ ’ 1

Correlation of Fixed Effects:
           (Intr) TrtmnD
TreatmentD -0.338       
TreatmentN -0.399  0.509

Risposte:


12

Sebbene ottenere un analogo della "varianza proporzionale spiegata da ciascun effetto" sia in linea di principio possibile per i GLMM, esistono diversi fattori complicanti (quali livelli del modello consideri la "varianza totale" e come quantificare la variazione di campionamento a causa del distribuzione di campionamento [binomiale in questo caso] di livello più basso)? Nakagawa e Schielzeth (doi: 10.1111 / j.2041-210x.2012.00261.x) presentano un approccio generale al calcolo di R ^ 2 (proporzione della varianza totale spiegata) per gli LMM (G) che sono diventati piuttosto popolari in ecologia; Xu et al 2003adottare un approccio simile. In linea di principio questo approccio potrebbe probabilmente essere esteso per considerare la percentuale di varianza spiegata da termini diversi [ma si noti che la "proporzione di varianza" di tutti i termini nel modello considerato in questo modo probabilmente non aggiungerebbe fino al 100% - potrebbe essere più o meno].

Tuttavia, se il tuo revisore non è attaccato ai dettagli statistici e sarebbe soddisfatto di una spiegazione più euristica di "importanza", potresti sottolineare che la deviazione standard stimata tra le piante è 1,20, molto vicino all'entità del più grande effetto del trattamento (-1,18); ciò significa che le piante variano abbastanza, rispetto all'entità degli effetti del trattamento (ad esempio, l'intervallo del 95% degli effetti della pianta è di circa , da a ).- 1,96 σ + 1,96 σ4σ1.96σ+1.96σ

visivamente:

inserisci qui la descrizione dell'immagine


+1, sono incuriosito dalla tua menzione (presumo favorevole) di per i modelli non lineari. Qual è la tua opinione sulla discussione qui: quale misura pseudo-R2 è quella da segnalare per la regressione logistica (Cox & Snell o Nagelkerke)? R2
gung - Ripristina Monica

1
Stavo solo dicendo che non penso che sia una domanda folle o necessariamente mal posta. Ma sia la struttura gerarchica che i modelli simili a GLM aprono lattine di worm che rendono più difficile scegliere una risposta. Di solito non mi preoccupo, ma posso capire perché le persone vorrebbero provare a trovare numeri che misurassero la bontà di adattamento o l'importanza relativa dei termini in un modello, in modo ragionevole.
Ben Bolker,

È ragionevole. A proposito, cosa ne pensi del mio suggerimento che con 10 piante, 3 trattamenti e N = 30, l'OP potrebbe adattarsi a un modello usando entrambi come effetti fissi? Non penso necessariamente che questo sarebbe il modello finale giusto, ovviamente, ma mi sembra un modo potenzialmente ammissibile per testare se ci sono variazioni tra le piante e mettere entrambe le variabili su basi simili per il confronto.
gung - Ripristina Monica

mi sembra ragionevole.
Ben Bolker,

Adatto un modello con sia il trattamento che la pianta come effetti fissi come suggerito dal gung, e il termine Pianta aveva un valore p molto alto (p = 0,3). Sembra strano dato che, come dici tu, "la deviazione standard stimata tra le piante è 1,20, molto vicina all'entità del più grande effetto di trattamento (-1,18)"? Perché dovrebbe apparire insignificante in un ANOVA con 2 effetti fissi?
jwb4,

3

Quello che vuoi è testare se la varianza di PlantIDè . Tuttavia, questo è un test strano da provare a eseguire, perché il valore null è al limite dello spazio consentito. Tali test sono ancora in corso, ma molte persone sono molto a disagio con loro. 0

Nel tuo caso, hai più misure per pianta, quindi un approccio rapido e sporco è quello di eseguire un modello con PlantIDun effetto fisso e testarlo.


1

La semplice risposta al tuo recensore è "Sì". Se ti sta chiedendo di verificare se la varianza dell'effetto casuale è significativamente diversa da 0, hai un paio di opzioni. Si noti tuttavia che molte persone intelligenti non si sentono a proprio agio con i test se le varianze degli effetti casuali sono diverse da 0.

Il più semplice è un test del rapporto di verosimiglianza, sebbene non raccomandato dalla maggior parte. Sono molto prudenti quando si eseguono test ai limiti (vale a dire che si sta testando contro una varianza di 0 che è il più basso possibile). Esiste una regola empirica che il valore p è circa il doppio di quello che è realmente.

Il metodo consigliato nella maggior parte dei luoghi è un bootstrap parametrico. È possibile utilizzare bootMerdal lme4pacchetto. Assicurati di aver impostato il parametro REML della tua funzione lmer su FALSE, altrimenti la tua varianza sarà maggiore dello 0 100% del tempo (o vicino ad esso ... in realtà sarà probabilmente maggiore dello 0 quasi il 100% del tempo comunque).

Alcuni consigli e ulteriori risorse:

http://glmm.wikidot.com/faq (trova l'intestazione Come posso verificare se un effetto casuale è significativo?)

Test parametrico del bootstrap di lmer () per effetti fissi

http://www.r-bloggers.com/using-bootmer-to-do-model-comparison-in-r/


Grazie per questa guida lucida (e pronta!) Al confronto tra modelli. Ma come interpreterei la "grandezza" dell'effetto della variabile casuale? cioè, come potrei confrontare la varianza spiegata dalla mia variabile casuale con la varianza spiegata dalla variabile fissa (trattamento)? Immagino di non vedere come questo sia ricavato dai risultati del test LRT avviato.
jwb4,

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.