Qual è la strategia appropriata per decidere quale modello utilizzare con i dati di conteggio? Ho dei dati di conteggio che devo modellare come modello multilivello e mi è stato consigliato (su questo sito) che il modo migliore per farlo è tramite bug o MCMCglmm. Tuttavia sto ancora cercando di conoscere le statistiche bayesiane e ho pensato che avrei dovuto prima provare ad adattare i miei dati come modelli lineari generalizzati e ignorare la struttura nidificata dei dati (solo così posso avere una vaga idea di cosa aspettarmi).
Circa il 70% dei dati sono 0 e il rapporto di varianza rispetto alla media è 33. Quindi i dati sono piuttosto dispersi.
Dopo aver provato una serie di opzioni diverse (tra cui poisson, binomio negativo, modello gonfiato quasi e zero) vedo poca coerenza nei risultati (variare da tutto ciò che è significativo a nulla è significativo).
Come posso prendere una decisione informata su quale tipo di modello scegliere in base all'inflazione 0 e all'eccessiva dispersione? Ad esempio, come posso dedurre che il quasi-poisson è più appropriato del binomio negativo (o viceversa) e come posso sapere che l'uso di uno di essi ha gestito adeguatamente (o meno) gli zeri in eccesso? Allo stesso modo, come posso valutare che non vi è più dispersione eccessiva se viene utilizzato un modello a gonfiaggio zero? o come dovrei decidere tra un poisson gonfiato zero e un binomio negativo zero gonfiato?