Ho un esperimento di misure ripetute in cui la variabile dipendente è una percentuale e ho più fattori come variabili indipendenti. Mi piacerebbe usare glmer
dal pacchetto R lme4
per trattarlo come un problema di regressione logistica (specificando family=binomial
) poiché sembra adattarsi direttamente a questa configurazione.
I miei dati si presentano così:
> head(data.xvsy)
foldnum featureset noisered pooldur dpoolmode auc
1 0 mfcc-ms nr0 1 mean 0.6760438
2 1 mfcc-ms nr0 1 mean 0.6739482
3 0 melspec-maxp nr075 1 max 0.8141421
4 1 melspec-maxp nr075 1 max 0.7822994
5 0 chrmpeak-tpor1d nr075 1 max 0.6547476
6 1 chrmpeak-tpor1d nr075 1 max 0.6699825
ed ecco il comando R che speravo fosse appropriato:
glmer(auc~1+featureset*noisered*pooldur*dpoolmode+(1|foldnum), data.xvsy, family=binomial)
Il problema è che il comando si lamenta del fatto che la mia variabile dipendente non è un numero intero:
In eval(expr, envir, enclos) : non-integer #successes in a binomial glm!
e l'analisi di questi dati (pilota) dà come risultato risposte strane.
Capisco perché la binomial
famiglia prevede numeri interi (conteggi sì-no), ma sembra che dovrebbe essere OK regredire direttamente i dati percentuali. Come fare questo?