La devianza è un concetto GLM, i modelli ZIP e ZINB non sono glm ma sono formulati come miscele finite di distribuzioni che sono GLM e quindi possono essere risolte facilmente tramite l'algoritmo EM.
Queste note descrivono la teoria della devianza in modo conciso. Se leggi quelle note vedrai la prova che il modello saturo per la regressione di Poisson ha probabilità logaritmica
ℓ ( λS) = ∑i = 1 , ∀ yio≠ 0n[ yiol o g( yio) - yio- l o g( yio! ) ]
che risultati dal plug-in stime .yio= λ^io
Procedo ora con la probabilità ZIP perché la matematica è più semplice, risultati simili valgono per lo ZINB. Sfortunatamente per lo ZIP, non esiste una relazione semplice come nel Poisson. I TH osservazioni log-verosimiglianza èio
ℓio( ϕ , λ ) = Ziol o g( ϕ + ( 1 - ϕ ) e- λ) + ( 1 - Zio) [ - λ + yiol o g( λ ) - l o g( yio! ) ] .
la non sono rispettati in modo da risolvere questo avresti bisogno di prendere derivate parziali WRT sia λ e φ , impostare le equazioni a 0 e poi risolvere per λ e φ . La difficoltà qui sono i y i = 0 valori, questi possono andare in un λ o in un φ e non è possibile senza osservare Z i cui inserire la y i = 0 osservazioni in. Tuttavia, se conoscessimo la Z iZioλφλφyio= 0λ^φ^Zioyio= 0Ziovalore non avremmo bisogno di un modello ZIP perché non avremmo dati mancanti. I dati osservati corrispondono alla probabilità di "dati completi" nel formalismo EM.
Un approccio che potrebbe essere ragionevole è lavorare con l'aspettativa rispetto a della verosimiglianza completa dei dati, E ( ℓ i ( ϕ , λ ) ) che rimuove Z i e sostituisce con un'aspettativa, questo fa parte di ciò che il L'algoritmo EM calcola (il passaggio E) con gli aggiornamenti più recenti. Non sono a conoscenza di alcuna letteratura che abbia studiato questo approccio all'e x p e c t e d devianza.ZioE ( ℓio( ϕ , λ ) )Zioe x p e c t e d
Inoltre, questa domanda è stata posta per prima, quindi ho risposto a questo post. Tuttavia, c'è un'altra domanda sullo stesso argomento con un bel commento di Gordon Smyth qui:
devianza per il modello di poisson composto gonfiato a zero, dati continui (R) in
cui ha menzionato la stessa risposta (questa è un'elaborazione di quel commento che avrei diciamo) più hanno menzionato nei commenti all'altro post un articolo che potresti voler leggere. (dichiarazione di non responsabilità, non ho letto il documento di riferimento)