Ho quasi le stesse domande come questa: come posso modellare in modo efficiente la somma delle variabili casuali di Bernoulli?
Ma l'impostazione è abbastanza diversa:
, , ~ 20, ~ 0.1
Abbiamo i dati per i risultati delle variabili casuali di Bernoulli: ,
Se stimiamo la con la stima della massima verosimiglianza (e otteniamo ), risulta che è molto più grande di allora previsti dagli altri criteri:p M L E i P { S = 3 } ( p M L E i ) P { S = 3 } ( p M L E i ) - P e x p e c t e d { S = 3 } ≈ 0,05
Pertanto, e non possono essere considerati indipendenti (hanno una piccola dipendenza). X j ( j > k )
Ci sono alcuni vincoli come questi: e (noto), che dovrebbe aiutare con la stima di .Σ s ≤ 2 P { S = s } = A P { S }
Come potremmo provare a modellare la somma delle variabili casuali di Bernoulli in questo caso?
Quale letteratura potrebbe essere utile per risolvere il compito?
AGGIORNATO
Ci sono altre idee:
(1) È possibile supporre che la dipendenza sconosciuta tra inizi dopo 1 o più successi in serie. Quindi quando , e . ∑ i = 1 , K X i >0 p K + 1 → p ′ K + 1 p ′ K + 1 < p K + 1
(2) Per usare MLE abbiamo bisogno del modello meno discutibile. Ecco una variante:
Σ i = 1 , k X i = 0 P { X 1 , . . . , X k , X k + 1 , . . . , X N se per qualsiasi k if e e per qualsiasi k.∑ i = 1 , k - 1 X i = 0 X k = 1 P ′ { X k + 1 = 1 , X k + 2 = 1 ,
(3) Poiché siamo interessati solo a , possiamo impostare (probabilità di successi per N- (k + 1) +1 somme dalla coda). E usa la parametrizzazioneP ' { x k + 1 , . . . , X N } ≈ P ″ { ∑ i = 1 , k X i = s ′ ; N - ( k + 1 ) + 1 = l } ∑ i = k + 1 , N X i P ″ { ∑
(4) Utilizzare MLE per il modello in base ai parametri e con per (e qualsiasi ) e alcuni altri vincoli nativi .p 0 , 1 , p 1 , 1 ; p 0 , 2 , p 1 , 2 , p 2 , 2 ; . . . p s ′ , l = 0 s ′ ≥ 6 l
Va tutto bene con questo piano?
AGGIORNATO 2
Alcuni esempi di distribuzione empirica (rosso) rispetto alla distribuzione di Poisson (blu) (le medie di poisson sono 2.22 e 2.45, le dimensioni del campione sono 332 e 259):

Per i campioni (A1, A2) con le punte di poisson 2.28 e 2.51 (le dimensioni del campione sono 303 e 249):

Per samlpe unito A1 + A2 (la dimensione del campione è 552):

Sembra che una certa correzione a Poisson dovrebbe essere il modello migliore :).