Sto cercando di modellare i dati di conteggio in R che sono apparentemente sottodispersi (parametro di dispersione ~ .40). Questo è probabilmente il motivo per cui un glm
con family = poisson
o binomiale negativa ( glm.nb
modello) non sono significativi. Quando guardo i descrittivi dei miei dati, non ho la tipica inclinazione dei dati di conteggio e anche i residui nelle mie due condizioni sperimentali sono omogenei.
Quindi le mie domande sono:
Devo anche usare analisi di regressione speciali per i miei dati di conteggio, se i miei dati di conteggio non si comportano davvero come i dati di conteggio? A volte mi trovo ad affrontare una non normalità (di solito a causa della curtosi), ma ho usato il metodo percentile del bootstrap per confrontare i mezzi tagliati (Wilcox, 2012) per spiegare la non normalità. I metodi per i dati di conteggio possono essere sostituiti da qualsiasi metodo valido suggerito da Wilcox e realizzato nel pacchetto WRS?
Se devo utilizzare le analisi di regressione per i dati di conteggio, come posso tenere conto della sotto dispersione? Il Poisson e la distribuzione binomiale negativa assumono una dispersione più elevata, quindi non dovrebbe essere appropriato, giusto? Stavo pensando di applicare la distribuzione di quasi-Poisson , ma di solito è consigliata per un'eccessiva dispersione. Ho letto dei modelli beta-binomiali che sembrano essere in grado di spiegare la sovra-e la sottodispersione sono disponibili nel
VGAM
pacchetto di R. Gli autori sembrano tuttavia raccomandare una distribuzione di Poisson ridotta , ma non riesco a trovarlo nel pacchetto .
Qualcuno può raccomandare una procedura per i dati non dispersi e forse fornire qualche esempio di codice R per esso?