Qual è la distribuzione di probabilità di questa somma casuale di variabili di Bernoulli non iid?


9

Sto cercando di trovare la distribuzione di probabilità di una somma di un numero casuale di variabili che non sono distribuite in modo identico. Ecco un esempio:

John lavora in un call center del servizio clienti. Riceve chiamate con problemi e cerca di risolverli. Quelli che non riesce a risolvere, li inoltra al suo superiore. Supponiamo che il numero di chiamate che riceve in un giorno segua una distribuzione di Poisson con media . La difficoltà di ogni problema varia da cose piuttosto semplici (che può sicuramente affrontare) a domande molto specializzate che non saprà risolvere. Supponiamo che la probabilità sarà in grado di risolvere l' i -problema che segue una distribuzione Beta con parametrip iμpiα e ed è indipendente dai problemi precedenti. Qual è la distribuzione del numero di chiamate che risolve in un giorno?β

Più formalmente, ho:

Y=I(N>0)i=0NXi peri=0,1,2,...,N

dove , e( X i | p i ) B e r n o u l l i ( p i ) p iB e t a ( α ,NPoisson(μ)(Xi|pi)Bernoulli(pi)piBeta(α,β)

Nota che, per ora, sono felice di presumere che gli siano indipendenti. Accetterei anche che i parametri e non si influenzino a vicenda sebbene in un esempio di vita reale di questo quando è grande, i parametri e sono tali che la distribuzione Beta ha più massa su basse percentuali di successoXiμ,αβμαβp . Ma ignoriamolo per ora.

Posso calcolare ma questo è tutto. Posso anche simulare i valori per avere un'idea di come sia la distribuzione di (sembra Poisson ma non so se ciò dipende dai numeri di e β che ho provato o se si generalizza, e come potrebbe cambiare per diversi valori di parametro). Hai idea di cosa sia questa distribuzione o di come potrei derivarne?P(Y=0) μ , αYμ,αβ

Tieni presente che ho anche pubblicato questa domanda sul forum TalkStats, ma ho pensato che avrebbe potuto ottenere maggiore attenzione qui. Ci scusiamo per il cross-posting e molte grazie in anticipo per il tuo tempo.

EDIT : Come si scopre (vedi le risposte molto utili di seguito - e grazie per quelle!), È davvero un distribuzione, qualcosa che stavo indovinando in base alla mia intuizione e ad alcune simulazioni, ma non sono stato in grado di dimostrare. Ciò che ora trovo sorprendente però è che la distribuzione di Poisson dipende solo dalla media diBPoisson(μαα+β) distribuzione, ma non è influenzato dalla sua varianza.Betun'

Ad esempio, le seguenti due distribuzioni Beta hanno la stessa media ma varianza diversa. Per chiarezza, il pdf blu rappresenta un e quello rosso B e t a ( 0.75 , 0.75Betun'(2,2) .Betun'(0.75,0.75)

Distribuzioni beta

Tuttavia, essi sarebbero entrambi risultato nella stessa distribuzione che, a me, sembra poco intuitivo. (Non dire che il risultato è sbagliato, solo sorprendente!)Poisson(0.5μ)


Per fisso c'è distribuzione binomiale di Poisson ma il tuo problema è più complicato di così. N
Tim

Grazie, conosco la distribuzione binomiale di Poisson, ma è casuale qui. N
Costantinopoli,

Potresti dare un'occhiata al composto Poisson , ma potresti aver bisogno di fare un po 'di lavoro con gli 0 per renderlo utile
Glen_b -Restate Monica

Risposte:


6

Le chiamate (ovvero la ) arrivano secondo un processo di Poisson. Il numero totale di chiamate N segue una distribuzione di Poisson. Dividi le chiamate in due tipi, ad esempio se X i = 1 o X i = 0 . L'obiettivo è determinare il processo che genera 1 s. Questo è banale se X i = 1 con una probabilità fissa p : dal principio di sovrapposizione dei processi di Poisson, l'intero processo ridotto a solo 1 s sarebbe anche un processo di Poisson, con velocità p μXioNXio=1Xio=01Xio=1p1pμ. In realtà è così, è sufficiente un ulteriore passaggio per arrivarci.

Marginalizzare su , in modo che P r ( X i | α , β ) = 1 0 p X i i ( 1 - p i ) 1 - X i p α - 1 i ( 1 - p i ) β - 1pio

Pr(Xio|α,β)=01pioXio(1-pio)1-Xiopioα-1(1-pio)β-1B(α,β)dpio=B(Xio+α,1-Xio+β)B(α,β)

Dove è la funzione beta. Utilizzando il fatto cheΓ(x+1)=xΓ(x), quanto sopra semplifica a;B(un',B)=Γ(un')Γ(B)Γ(un'+B)Γ(X+1)=XΓ(X)

In altre parole,XiBernoulli(α

Pr(Xio=1|α,β)=Γ(1+α)Γ(β)Γ(1+α+β)Γ(α+β)Γ(α)Γ(β)=αα+β
. Per la proprietà di sovrapposizione,Yè Poisson distribuito con velocitàαμXio~Bernoullio(αα+β)Yαμα+β .

Un esempio numerico (con R) ... nella figura, le linee verticali provengono dalla simulazione e i punti rossi sono i pmf derivati ​​sopra:

draw <- function(alpha, beta, mu) 
{ N <- rpois(1, mu); p = rbeta(N, alpha, beta); sum(rbinom(N, size=1, prob=p)) }

pmf <- function(y, alpha, beta, mu)
  dpois(y, alpha*mu/(alpha+beta))

y <- replicate(30000,draw(4,5,10))
tb <- table(y)

# simulated pmf
plot(tb/sum(tb), type="h", xlab="Y", ylab="Probability")
# analytic pmf
points(0:max(y), pmf(0:max(y), 4, 5, 10), col="red")

inserisci qui la descrizione dell'immagine


3
  1. pioBeta(α,β)E[pio]=αα+βio

  2. μαα+βμαα+β

  3. P(Y=0)=e-μα/(α+β)

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.