Ho un set di dati che mi aspetto di seguire una distribuzione di Poisson, ma è sovradisperso di circa 3 volte. Al momento, sto modellando questa sovraispersione usando qualcosa come il seguente codice in R.
## assuming a median value of 1500
med = 1500
rawdist = rpois(1000000,med)
oDdist = rawDist + ((rawDist-med)*3)
Visivamente, questo sembra adattarsi molto bene ai miei dati empirici. Se sono soddisfatto dell'adattamento, c'è qualche motivo per cui dovrei fare qualcosa di più complesso, come usare una distribuzione binomiale negativa, come descritto qui ? (In tal caso, qualsiasi puntatore o collegamento in tal senso sarebbe molto apprezzato).
Oh, e sono consapevole che questo crea una distribuzione leggermente frastagliata (a causa della moltiplicazione per tre), ma ciò non dovrebbe importare per la mia applicazione.
Aggiornamento: per chiunque altro cerchi e trovi questa domanda, ecco una semplice funzione R per modellare un poisson sovradisperso usando una distribuzione binomiale negativa. Impostare d sul rapporto media / varianza desiderato:
rpois.od<-function (n, lambda,d=1) {
if (d==1)
rpois(n, lambda)
else
rnbinom(n, size=(lambda/(d-1)), mu=lambda)
}
(tramite la mailing list R: https://stat.ethz.ch/pipermail/r-help/2002-June/022425.html )