Poisson è esponenziale come Gamma-Poisson è cosa?


16

Una distribuzione di Poisson può misurare eventi per unità di tempo e il parametro è λ . La distribuzione esponenziale misura il tempo fino al prossimo evento, con il parametro 1λ . Uno può convertire una distribuzione nell'altra, a seconda che sia più semplice modellare eventi o tempi.

Ora, un gamma-poisson è un poisson "allungato" con una varianza maggiore. Una distribuzione di Weibull è un esponenziale "allungato" con una varianza maggiore. Ma questi due possono essere facilmente convertiti l'uno nell'altro, allo stesso modo in cui Poisson può essere convertito in esponenziale?

O c'è qualche altra distribuzione che è più appropriata da usare in combinazione con la distribuzione gamma-poisson?

Il gamma-poisson è anche noto come distribuzione binomiale negativa o NBD.

Risposte:


14

Questo è un problema piuttosto semplice. Sebbene ci sia una connessione tra le distribuzioni binomiali di Poisson e Negative, in realtà penso che ciò non sia utile per la tua domanda specifica in quanto incoraggia le persone a pensare a processi binomiali negativi. Fondamentalmente, hai una serie di processi Poisson:

Yio(tio)|λio~PoioSSon(λiotio)

Dove è il processo e t i è il tempo si osserva, e ho denota gli individui. E stai dicendo che questi processi sono "simili" legando insieme i tassi con una distribuzione:Yiotioio

λio~solun'mmun'(α,β)

Nel fare l'integrazione / mxixing su , hai:λio

Yio(tio)|αβ~NegBion(α,pio)wherepio=tiotio+β

Questo ha un pmf di:

Pr(Yio(tio)=yio|αβ)=Γ(α+yio)Γ(α)yio!pioyio(1-pio)α

Per ottenere la distribuzione dei tempi di attesa notiamo che:

= 1 - ( 1 - p i ) α = 1 - ( 1 t

Pr(Tiotio|αβ)=1-Pr(Tio>tio|αβ)=1-Pr(Yio(tio)=0|αβ)
=1-(1-pio)α=1-(1+tioβ)-α

Differenzia questo e hai il PDF:

pTi(ti|αβ)=αβ(1+tiβ)(α+1)

Questo è un membro delle distribuzioni generalizzate di Pareto, tipo II. Lo userei come distribuzione dei tempi di attesa.

Per vedere la connessione con la distribuzione di Poisson, nota che , quindi se impostiamoβ=ααβ=E(λi|αβ) e quindi prendiamo il limiteαotteniamo:β=αλα

limααβ(1+tiβ)(α+1)=limαλ(1+λtiα)(α+1)=λexp(λti)

1α


1
You can also note that the waiting time distribution is, roughly speaking, an exponential distribution with a Gamma random rate parameter and strictly speaking this is a Beta distribution of the second kind, as for any Gamma distribution with a Gamma random rate parameter.
Stéphane Laurent

Using @probabilityislogic as a basis, I found the following article providing more detail on the relationship between NBD and Pareto: Gupta, Sunil and Donald G. Morrison. Estimating Heterogeneith in Consumers' Purchase Rates. Marketing Science, 1991, 10(3), 264-269. Thanks to all who helped me answer this question.
zbicyclist

+1, suppongo che questa bella forma analitica potrebbe non esistere più per PoioSSon(λiotio+c), dove c è una costante.
Randel,

1
@randel - potresti ottenere un modulo "bello" notando che questo camper è la somma di due camper indipendenti ...Zio=Yio+Xio dove Yio è lo stesso di sopra e Xio~poioSSon(c). ComeXio non dipende da λio o Yio il pdf di Zioè la convoluzione del pdf binomiale negativo sopra e un pdf di poisson. Per ottenere la distribuzione del tempo di attesa basta moltiplicarePr(Yio=0) nella risposta sopra di Pr(Xi=0)=ec. You then get waiting time cdf of 1ec(1+tiβ)α and pdf of ecαβ(1+tiβ)(α+1).
probabilityislogic

1
Questo non funzionerà in termini di distribuzione del missaggio, perché è necessario λio<ctio-1(altrimenti la media di Poisson è negativa). La distribuzione del mixaggio gamma avrebbe bisogno di essere troncata (ho anche pensato chec>0nella mia risposta precedente). Ciò significherebbe nessuna distribuzione nb.
probabilityislogic

4

One possibility: Poisson is to Exponential as Negative-Binomial is to ... Exponential!

There is a pure-jump increasing Lévy process called the Negative Binomial Process such that at time t the value has a negative binomial distribution. Unlike the Poisson process, the jumps are not almost surely 1. Instead, they follow a logarithmic distribution. By the law of total variance, some of the variance comes from the number of jumps (scaled by the average size of the jumps), and some of the variance comes from the sizes of the jumps, and you can use this to check that it is overdispersed.

There may be other useful descriptions. See "Framing the negative binomial distribution for DNA sequencing."


Let me be more explicit about how the Negative Binomial Process described above can be constructed.

  • Choose p<1.

  • Let X1,X2,X3,... be IID with logarithmic distributions, so P(xi=k)=1log(1p)pkk.

  • Let N be a Poisson process with constant rate log(1p), so N(t)=Pois(tlog(1p)).

  • Let NBP be the process so that

NBP(t)=i=1N(t)Xi.

NBP is a pure jump process with logarithmically distributed jumps. The gaps between jumps follow an exponential distribution with rate log(1p).

I don't think it is obvious from this description that NBP(t) has a negative binomial NB(t,p) distribution, but there is a short proof using probability generating functions on Wikipedia, and Fisher also proved this when he introduced the logarithmic distribution to analyze the relative frequencies of species.


1
No, any compound Poisson process has an exponential waiting time. This means you add Pois(λt) IID random variables with some distribution.
Douglas Zare,

No, questo non è ciò che si intende per processo composto di Poisson. en.wikipedia.org/wiki/Compound_Poisson_process "I salti arrivano in modo casuale secondo un processo di Poisson e anche la dimensione dei salti è casuale, con una distribuzione di probabilità specificata." Non ho detto variabili IID Poisson. Prendi ilNla somma parziale delle variabili casuali logaritmiche IID dove Nè il valore di un processo di Poisson.
Douglas Zare,

Se moltiplichi un processo di Poisson per 2, questo non è un processo di Poisson e i tempi di attesa rimangono esponenziali.
Douglas Zare,


0

Non sono ancora in grado di commentare, quindi mi scuso se non è una soluzione definitiva.

Stai chiedendo la distribuzione appropriata da utilizzare con un NB ma appropriato non è del tutto definito. Se una distribuzione appropriata significa appropriata per spiegare i dati e stai iniziando con un Poisson sovradisperso, potresti dover esaminare ulteriormente la causa dell'iperdispersione. Il NB non distingue tra un Poisson con mezzi eterogenei o una dipendenza di occorrenza positiva (che un evento che si verifica aumenta la probabilità che si verifichi un altro). Nel tempo continuo esiste anche una dipendenza dalla durata, ad esempio una dipendenza positiva dalla durata significa che il passare del tempo aumenta la probabilità di un evento. È stato anche dimostrato che la dipendenza negativa dalla durata provoca asintoticamente un Poisson sovradisperso [1] . Ciò si aggiunge all'elenco di quello che potrebbe essere il modello di tempo di attesa appropriato.


1
causa dell'overdispersione: si tratta dei dati di acquisto dei consumatori. I singoli consumatori sono in difficoltà, ognuno con un tasso di acquisto lambda. Ma non tutti i consumatori hanno la stessa lambda - questa è la causa della sovradispersione. Le tariffe di acquisto lambda sono considerate distribuite come gamma. Questo è un modello comune (risale a ASC Ehrenberg), ma non ho trovato nulla nei suoi scritti che risponda a questa domanda.
zbicyclist,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.