Sto cercando di impaginare da solo quando è appropriato usare quale tipo di regressione (geometrico, Poisson, binomiale negativo) con i dati di conteggio, all'interno del framework GLM (solo 3 delle 8 distribuzioni GLM sono usate per i dati di conteggio, sebbene la maggior parte di ciò che Ho letto i centri attorno alle distribuzioni binomiali e di Poisson negative).
Quando utilizzare i GLM binomiali Poisson vs. geometrici vs. negativi per i dati di conteggio?
Finora ho la seguente logica: conta i dati? Se sì, la media e la varianza sono disuguali? Se sì, regressione binomiale negativa. In caso negativo, regressione di Poisson. C'è zero inflazione? In caso affermativo, Poisson zero gonfiato o binomio negativo zero gonfiato.
Domanda 1 Non sembra esserci una chiara indicazione di quale utilizzare quando. C'è qualcosa per informare quella decisione? Da quello che ho capito, una volta che si passa a ZIP, la varianza media a parità di ipotesi si attenua, quindi è abbastanza simile a NB.
Domanda 2 Dove si inserisce la famiglia geometrica in questo o quale tipo di domande dovrei fare dei dati quando decido se usare una famiglia geometrica nella mia regressione?
Domanda 3 Vedo persone che scambiano continuamente il binomio negativo e le distribuzioni di Poisson ma non geometriche, quindi immagino che ci sia qualcosa di nettamente diverso su quando usarlo. Se è così, che cosa è?
PS Ho fatto un diagramma (probabilmente semplificato, dai commenti) ( modificabile ) della mia attuale comprensione se la gente volesse commentare / modificare la discussione.