Adattare un GLMM binomiale (glmer) a una variabile di risposta che è una proporzione o una frazione


11

Spero che qualcuno possa aiutare con quella che penso sia una domanda relativamente semplice, e penso di conoscere la risposta, ma senza conferma è diventata qualcosa di cui non posso essere certo.

Ho alcuni dati di conteggio come variabile di risposta e voglio misurare come cambia quella variabile con la presenza proporzionale di qualcosa.

Più in dettaglio, la variabile di risposta è il conteggio della presenza di una specie di insetto in un numero di siti, quindi ad esempio un sito viene campionato 10 volte e questa specie può verificarsi 4 volte.

Voglio vedere se questo è correlato alla presenza proporzionale di un gruppo di specie vegetali nella comunità generale delle piante in questi siti.

Questo significa che i miei dati sono i seguenti (questo è solo un esempio)

Site, insectCount, NumberOfInsectSamples, ProportionalPlantGroupPresence
1, 5, 10, 0.5
2, 3, 10, 0.3
3, 7, 9, 0.6
4, 0, 9, 0.1

I dati includono anche un effetto casuale per la posizione.

Ho pensato a due metodi, uno sarebbe un modello lineare ( lmer) con gli insetti convertiti in una proporzione ad es

 lmer.model<-lmer(insectCount/NumberOfInsectSamples~
 ProportionalPlantGroupPresence+(1|Location),data=Data)

Il secondo sarebbe un GLMM binomiale ( glmer) ad es

glmer.model <- glmer(cbind(insectCount,NumberOfInsectSamples-insectCount)~
 ProportionalPlantGroupPresence+(1|Location),
 data=Data,family="binomial")

Credo che il bagliore binomiale sia il metodo corretto, tuttavia producono risultati abbastanza diversi. Non riesco a trovare una risposta definitiva in rete senza sentirmi ancora leggermente incerto e desidero assicurarmi di non sbagliare.

Qualsiasi aiuto o approfondimento su metodi alternativi su questo sarebbe molto apprezzato.


Risposte:


19

Il GLMM binomiale è probabilmente la risposta giusta.

  • Soprattutto con un numero di campioni da piccolo a moderato (9 e 10 nel tuo esempio), la distribuzione della variabile di risposta sarà probabilmente eteroscedastica (la varianza non sarà costante, e in particolare dipenderà dalla media in modo sistematico) e lontano dalla Normalità, in un modo che sarà difficile da trasformare, specialmente se le proporzioni sono vicine a 0 o 1 per alcuni valori della variabile predittore. Questo rende il GLMM una buona idea.
  • Si dovrebbe fare attenzione a controllare / account per overdispersion. Se hai una singola osservazione (cioè un singolo campione / riga binomiale nel tuo frame di dati) per posizione, il tuo (1|Site)effetto casuale lo gestirà automaticamente (anche se vedi Harrison 2015 per una nota cautelativa)
  • se il presupposto precedente è corretto (hai solo un singolo campione binomiale per posizione), puoi anche adattarlo come un normale modello binomiale ( glm(...,family=binomial)- in quel caso puoi anche usare un modello quasibinomiale ( family=quasibinomial) come un modo più semplice e alternativo per tenere conto della sovradispersione
  • se ti piace puoi anche adattare il tuo GLMM con la proporzione come risposta, se imposti l' weightsargomento in modo che sia uguale al numero di campioni:

     glmer(insectCount/NumberOfInsectSamples~ProportionalPlantGroupPresence+
           (1|Location),
           weights=NumberofInsectSamples,
           data=Data,family="binomial")

    (questo dovrebbe dare risultati identici glmer()all'adattamento che hai nella tua domanda).

Harrison, Xavier A. " Un confronto tra effetti casuali a livello di osservazione e modelli beta-binomiali per modellare la sovradispersione in dati binomiali in ecologia ed evoluzione ." PeerJ 3 (21 luglio 2015): e1114. doi: 10,7717 / peerj.1114.


Ciao Ben, Mille grazie per la tua risposta chiara e completa!
LA
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.