Ci scusiamo per la risposta tardiva, ma anche questo mi ha infastidito e ho trovato la risposta. La distribuzione è davvero Dirichlet-Multinomial e l'individuo neg. le distribuzioni binomiali non devono nemmeno essere identiche, purché il loro fattore di Fano (rapporto tra varianza e media) sia identico.
Risposta lunga:
Se si parametrizza NB come:
p ( X= x | λ , θ ) = NB ( x | λ , θ ) = ( θ- 1λ + x - 1X) (11 + θ- 1)X( θ- 11 + θ- 1)θ- 1λ
Quindi e eE( X) = λVa r ( X) = λ ( 1 + θ )
∀ i : Xio∼ NB ( λio, θ ) implica
∑ Xio∼ NB ( ∑ λio, θ )
Quindi prendendo la probabilità data la somma:
∏ NB ( xio| λio, θ )NB ( ∑ xio| ∑ λio, θ )= ( 11 + θ- 1)∑ xio( θ- 11 + θ- 1)θ- 1∑ λio∏ ( θ- 1λio+ xio- 1Xio)( 11 + θ- 1)∑ xio( θ- 11 + θ- 1)θ- 1∑ λio( θ- 1∑ λio+ ∑ xio- 1∑ xio)== Γ ( ∑ xio+ 1 ) Γ (θ-1Σλio)Γ ( θ-1Σλio+ ∑xio)∏ Γ ( θ- 1λio+xio)Γ ( xio+ 1 ) Γ ( θ- 1λio)= D M( x1, . . . , xn| θ- 1λ1, . . . , θ- 1λn)
dove è la probabilità Dirichlet-Multinomial. Ciò deriva semplicemente dal fatto che, fatta eccezione per i coefficienti multinomiali, molti dei termini nella frazione sul lato sinistro si annullano, lasciandoti solo con i termini della funzione gamma che risultano essere gli stessi della probabilità DM.D M
Si noti inoltre che i parametri di questo modello non sono identificabili come un aumento di con una diminuzione simultanea di tutti comporta esattamente la stessa probabilità.θλio
Il miglior riferimento che ho per questo è le sezioni da 2 a 3.1 di Guimarães & Lindrooth (2007): Controllo della sovradispersione in modelli logit condizionali raggruppati: un'applicazione computazionalmente semplice della regressione multinomiale di Dirichlet - purtroppo è protetta da un muro, ma non sono stato in grado di trova un riferimento senza paywall.