Grazie per l'interessante domanda!
Differenza: una limitazione dei modelli di conteggio standard è che si presume che gli zeri e i nonzeros (positivi) provengano dallo stesso processo di generazione dei dati. Con i modelli di ostacolo , questi due processi non sono vincolati per essere gli stessi. L'idea di base è che una probabilità di Bernoulli governa l'esito binario del fatto che una variabile conte abbia una realizzazione zero o positiva. Se la realizzazione è positiva, l'ostacolo viene attraversato e la distribuzione condizionale dei positivi è regolata da un modello di dati di conteggio a zero zero. Con modelli a gonfiaggio zero, la variabile di risposta è modellata come una miscela di una distribuzione di Bernoulli (o la chiama una massa di punti a zero) e una distribuzione di Poisson (o qualsiasi altra distribuzione di conteggio supportata su numeri interi non negativi). Per maggiori dettagli e formule, vedi, ad esempio, Gurmu e Trivedi (2011) e Dalrymple, Hudson e Ford (2003).
Esempio: i modelli di ostacolo possono essere motivati da processi decisionali sequenziali confrontati da individui. Decidi innanzitutto se devi acquistare qualcosa, quindi decidi la quantità di quel qualcosa (che deve essere positivo). Quando ti è permesso (o puoi potenzialmente) acquistare nulla dopo la tua decisione di acquistare qualcosa è un esempio di una situazione in cui il modello a zero inflazione è appropriato. Gli zeri possono provenire da due fonti: a) nessuna decisione di acquisto; b) voleva acquistare ma alla fine non ha acquistato nulla (ad es. esaurito).
Beta: il modello di ostacolo è un caso speciale del modello in due parti descritto nel capitolo 16 di Frees (2011). Lì, vedremo che per i modelli in due parti, la quantità di assistenza sanitaria utilizzata può essere una variabile continua e una conta. Quindi ciò che è stato in qualche modo definito in modo confuso "distribuzione beta a zero inflazione" in letteratura appartiene infatti alla classe delle distribuzioni e dei modelli in due parti (così comuni nella scienza attuariale), che è coerente con la precedente definizione di un modello di ostacolo . Questo eccellente libro ha discusso dei modelli a gonfiaggio zero nella sezione 12.4.1 e dei modelli di ostacolo nella sezione 12.4.2, con formule ed esempi da applicazioni attuariali.
Storia: i modelli Poisson (ZIP) a zero inflazione senza covariate hanno una lunga storia (vedi ad esempio Johnson e Kotz, 1969). La forma generale dei modelli di regressione ZIP che incorporano le covariate è dovuta a Lambert (1992). I modelli di ostacolo furono inizialmente proposti dallo statistico canadese Cragg (1971), e successivamente sviluppati ulteriormente da Mullahy (1986). Puoi anche considerare Croston (1972), dove i conteggi geometrici positivi vengono usati insieme al processo di Bernoulli per descrivere un processo a valori interi dominato dagli zeri.
R: Infine, se usi R, esiste un pacchetto pscl per "Classi e metodi per la R sviluppati nel laboratorio computazionale di scienze politiche" di Simon Jackman, contenente le funzioni hurdle () e zeroinfl () di Achim Zeileis.
I seguenti riferimenti sono stati consultati per produrre quanto sopra:
- Gurmu, S. & Trivedi, Zeri in eccesso PK nei modelli di conteggio per i viaggi ricreativi Journal of Business & Economic Statistics, 1996, 14, 469-477
- Johnson, N., Kotz, S., Distribuzioni in statistica: Distribuzioni discrete. 1969, Houghton MiZin, Boston
- Lambert, D., regressione di Poisson a gonfiaggio zero con un'applicazione ai difetti di fabbricazione. Technometrics, 1992, 34 (1), 1–14.
- Cragg, JG Alcuni modelli statistici per variabili dipendenti limitate con applicazione alla domanda di beni durevoli Econometrica, 1971, 39, 829-844
- Mullahy, J. Specifica e test di alcuni modelli di dati di conteggio modificati Journal of Econometrics, 1986, 33, 341-365
- Libera, EW Regressione Modelling con applicazioni attuariali e finanziarie Cambridge University Press, 2011
- Dalrymple, ML; Hudson, IL & Ford, Miscela finita RPK, Poisson a gonfiaggio zero e modelli di ostacolo con applicazione alle statistiche computazionali SIDS e analisi dei dati, 2003, 41, 491-504
- Croston, JD Previsione e controllo delle scorte per le richieste intermittenti Ricerca operativa trimestrale, 1972, 23, 289-303