Per analizzare i conteggi di uccelli a gonfiamento zero, vorrei applicare i modelli di conteggio a gonfiamento zero utilizzando il pacchetto R pscl . Tuttavia, guardando l'esempio fornito nella documentazione per una delle funzioni principali ( ? Zeroinfl ), inizio a dubitare di quale sia il vero vantaggio di questi modelli. In base al codice di esempio fornito, ho calcolato i modelli standard di poisson, quasi-poisson e negativi bionomiali, semplici poisson zero-inflated e modelli binomiali negativi e poisson-inflated zero e modelli binomial negativi con regressori per il componente zero. Quindi ho ispezionato gli istogrammi dei dati osservati e adattati. (Ecco il codice per replicarlo.)
library(pscl)
data("bioChemists", package = "pscl")
## standard count data models
fm_pois <- glm(art ~ ., data = bioChemists, family = poisson)
fm_qpois <- glm(art ~ ., data = bioChemists, family = quasipoisson)
fm_nb <- glm.nb(art ~ ., data = bioChemists)
## with simple inflation (no regressors for zero component)
fm_zip <- zeroinfl(art ~ . | 1, data = bioChemists)
fm_zinb <- zeroinfl(art ~ . | 1, data = bioChemists, dist = "negbin")
## inflation with regressors
fm_zip2 <- zeroinfl(art ~ fem + mar + kid5 + phd + ment | fem + mar + kid5 + phd +
ment, data = bioChemists)
fm_zinb2 <- zeroinfl(art ~ fem + mar + kid5 + phd + ment | fem + mar + kid5 + phd +
ment, data = bioChemists, dist = "negbin")
## histograms
breaks <- seq(-0.5,20.5,1)
par(mfrow=c(4,2))
hist(bioChemists$art, breaks=breaks)
hist(fitted(fm_pois), breaks=breaks)
hist(fitted(fm_qpois), breaks=breaks)
hist(fitted(fm_nb), breaks=breaks)
hist(fitted(fm_zip), breaks=breaks)
hist(fitted(fm_zinb), breaks=breaks)
hist(fitted(fm_zip2), breaks=breaks)
hist(fitted(fm_zinb2), breaks=breaks)!
Non riesco a vedere alcuna differenza fondamentale tra i diversi modelli (a parte questo i dati di esempio non mi sembrano molto "gonfiati a zero" ...); in realtà nessuno dei modelli fornisce una stima ragionevole a metà del numero di zeri. Qualcuno può spiegare qual è il vantaggio dei modelli a gonfiaggio zero? Suppongo che ci sia stato un motivo per scegliere questo come esempio per la funzione.