Sto cercando di utilizzare lme4::glmer()
per adattare un modello misto generalizzato binomiale (GLMM) con una variabile dipendente che non è binaria, ma una variabile continua tra zero e uno. Si può pensare a questa variabile come a una probabilità; in effetti è la probabilità riportata da soggetti umani (in un esperimento che aiuto ad analizzare). Cioè non è una frazione "discreta", ma una variabile continua.
La mia glmer()
chiamata non funziona come previsto (vedi sotto). Perché? Cosa posso fare?
Modifica successiva: la mia risposta di seguito è più generale della versione originale di questa domanda, quindi ho modificato la domanda per essere anche più generale.
Più dettagli
Apparentemente è possibile usare la regressione logistica non solo per DV binario ma anche per DV continuo tra zero e uno. Anzi, quando corro
glm(reportedProbability ~ a + b + c, myData, family="binomial")
Ricevo un messaggio di avvertimento
Warning message:
In eval(expr, envir, enclos) : non-integer #successes in a binomial glm!
ma una misura molto ragionevole (tutti i fattori sono categorici, quindi posso facilmente verificare se le previsioni del modello sono vicine alle medie tra soggetti e lo sono).
Tuttavia, ciò che voglio effettivamente usare è
glmer(reportedProbability ~ a + b + c + (1 | subject), myData, family="binomial")
Mi dà l'avvertimento identico, restituisce un modello, ma questo modello è chiaramente molto spento; le stime degli effetti fissi sono molto lontane da glm()
quelle e dai mezzi trasversali. (E ho bisogno di includere glmerControl(optimizer="bobyqa")
nella glmer
chiamata, altrimenti non converge affatto.)
glmmadmb(reportedProbability ~ a + b + c + (1 | subject), myData, family="beta")
, ottengo la giusta misura e intervalli di confidenza ragionevoli, ma un avviso di convergenza fallito : - / Sto cercando di capire come aumentare il numero di iterazioni. Beta potrebbe funzionare per me perché non ho casi DV = 0 o DV = 1.
+ (1 | rowid)
alla mia chiamata glmer e questo produce stime stabili e intervalli di confidenza stabili, indipendentemente dalla mia scelta di peso (ho provato 100 e 500). Ho anche provato a eseguire lmer su logit (reportingProbability) e ottengo quasi esattamente la stessa cosa. Quindi entrambe le soluzioni sembrano funzionare bene! Beta MM con glmmadmb offre anche risultati molto vicini, ma per qualche motivo non riesce a convergere completamente e impiega un'eternità a funzionare. Valuta di pubblicare una risposta in cui sono elencate queste opzioni e spiega un po 'le differenze e i pro / contro! (Gli intervalli di confidenza che ho citato sono tutti Wald.)