Qual è la distribuzione della media arrotondata per difetto delle variabili casuali di Poisson?


20

Se ho variabili casuali che sono Poisson distribuite con i parametri λ 1 , λ 2 , , λ n , qual è la distribuzione di Y = n i = 1 X iX1,X2,,Xnλ1,λ2,,λnY=i=1nXin(cioè il numero intero della media)?

Una somma di Poisson è anche Poisson, ma non sono abbastanza fiducioso nelle statistiche per determinare se è lo stesso per il caso precedente.


@amoeba Ho annullato la modifica del titolo perché in realtà non si tratta di "arrotondamento". La precedente modifica di Cardinal, sebbene non altrettanto precisa, sembra preferibile perché è accurata.
whuber

@whuber Ok. Ero esitante nel fare questa modifica, ma ho deciso di includere la parola "arrotondamento" perché attualmente il titolo non suggerisce la principale difficoltà qui (e quindi è in qualche modo fuorviante). Il termine corretto dovrebbe essere "arrotondamento per difetto", quindi forse "Qual è la distribuzione di una media di variabili casuali di Poisson, arrotondata per difetto ?" - anche se lo ammetto, sembra un po 'ingombrante.
ameba dice Ripristina Monica il

@amoeba Altre modifiche sono benvenute!
whuber

Risposte:


27

Una generalizzazione della domanda richiede la distribuzione di quando la distribuzione di X è nota e supportata sui numeri naturali. (Nella domanda, X ha una distribuzione di Poisson del parametro λ = λ 1 + λ 2 + + λ n e m = n .)Y=X/mXXλ=λ1+λ2++λnm=n

La distribuzione di è facilmente determinata dalla distribuzione di m Y , la cui probabilità di generazione di funzione (PGF) può essere determinato in termini di PGF di X . Ecco uno schema della derivazione.YmYX


Scrivi per il pgf di X , dove (per definizione) p n = Pr ( X = n ) . m Y è costruito da X in modo tale che il suo pgf, q , siap(X)=p0+p1X++pnXn+Xpn=Pr(X=n)mYXq

q(X)=(p0+p1++pm-1)+(pm+pm+1++p2m-1)Xm++(pnm+pnm+1++p(n+1)m-1)Xnm+.

Perché questo converge assolutamente per , possiamo riorganizzare i termini in una somma di pezzi del modulo|X|1

Dm,tp(X)=pt+pt+mXm++pt+nmXnm+

per . La serie di potenze delle funzioni x t D m , t p costituiti da ogni m esimo termine della serie di p partire dalla t th : questo è talvolta chiamato decimazione di p . Le ricerche di Google al momento non forniscono molte informazioni utili sulle decimazioni, quindi per completezza, ecco una derivazione di una formula.t=0,1,...,m-1XtDm,tpmesimoptesimop

Lasciate essere qualsiasi primitiva m esima radice di unità; per esempio, prendi ω = exp ( 2 i π / m ) . Quindi segue da ω m = 1 e m - 1 j = 0 ω j = 0 cheωmesimoω=exp(2ioπ/m)ωm=1j=0m1ωj=0

xtDm,tp(X)=1mΣj=0m-1ωtjp(X/ωj).

Per vedere questo, nota che l'operatore è lineare, quindi è sufficiente controllare la formula sulla base { 1 , x , x 2 , ... , x n , ... } . Applicando il lato destro a x n si ottieneXtDm,t{1,X,X2,...,Xn,...}Xn

XtDm,t[Xn]=1mΣj=0m-1ωtjXnω-nj=XnmΣj=0m-1ω(t-n)j.

Quando e n differiscono per un multiplo di m , ogni termine nella somma è uguale a 1 e otteniamo x n . Altrimenti, i termini si alternano tra potenze di ω t - n e questi si sommano a zero. Da cui questo operatore conserva tutti i poteri di x congruente a t modulo me uccide tutti gli altri: è proprio la proiezione desiderata.tnm1Xnωt-nXtm

Una formula per segue prontamente cambiando l'ordine della somma e riconoscendo una delle somme come geometrica, scrivendola così in forma chiusa:q

q(x)=t=0m1(Dm,t[p])(x)=t=0m1xt1mj=0m1ωtjp(ωjx)=1mj=0m1p(ωjx)t=0m1(ωj/x)t=x(1xm)mj=0m1p(ωjx)xωj.

Ad esempio, il pgf di una distribuzione di Poisson del parametro è p ( x ) = exp ( λ ( x - 1 ) ) . Con m = 2 , ω = - 1 e il pgf di 2 Y saràλp(x)=exp(λ(x1))m=2ω=12Y

q(x)=x(1x2)2j=021p((1)jx)x(1)j=x1/x2(exp(λ(x1))x1+exp(λ(x1))x+1)=exp(λ)(sinh(λx)x+cosh(λx)).

Un uso di questo approccio è quello di calcolare i momenti di e m Y . Il valore della k esima derivata della PGF di valutazioni x = 1 è il k esimo momento fattoriale. Il k esima momento è una combinazione lineare dei primi k momenti fattoriali. Usando queste osservazioni troviamo, ad esempio, che per un Poisson distribuito X , la sua media (che è il primo momento fattoriale) è uguale a λ , la media di 2 ( X / 2 ) ⌋ è uguale a λXmYkthx=1kthkthkXλ2(X/2)e la media di3(X/3)⌋ èuguale aλ-1+e-3λ/2(sin ( λ12+12e-2λ3(X/3):λ1+e3λ/2(sin(3λ2)3+cos(3λ2))

Si intende

I mezzi per sono mostrati rispettivamente in blu, rosso e giallo, come funzioni di λ : asintoticamente, la media scende di ( m - 1 ) / 2 rispetto alla media originale di Poisson.m=1,2,3λ(m1)/2

Formule simili per le varianze possono essere ottenute. (Diventano disordinati quando alza e così vengono omessi. Una cosa che stabiliscono definitivamente è che quando m > 1 nessun multiplo di Y è Poisson: non ha la caratteristica uguaglianza di media e varianza) Ecco un diagramma delle varianze come una funzione di λ per m = 1 , 2 , 3 :mm>1Yλm=1,2,3

varianze

È interessante notare che per valori maggiori di aumentano le varianze . Intuitivamente, ciò è dovuto a due fenomeni in competizione: la funzione floor è effettivamente binning gruppi di valori che originariamente erano distinti; questo deve far diminuire la varianza . Allo stesso tempo, come abbiamo visto, anche i mezzi stanno cambiando (perché ogni cestino è rappresentato dal suo valore più piccolo); questo deve far sì che un termine uguale al quadrato della differenza di mezzi venga aggiunto di nuovo. L'aumento della varianza per λ di grandi dimensioni aumenta con valori maggiori di m .λλm

Il comportamento della varianza di con m è sorprendentemente complesso. Terminiamo con una rapida simulazione (in ) che mostra cosa può fare. I grafici mostrano la differenza tra la varianza di m X / m e la varianza di X per Poisson ha distribuito X con vari valori di λ compresi tra 1 e 5000 . In tutti i casi le trame sembrano aver raggiunto i loro valori asintotici a destra.mYmRmX/mXXλ15000

set.seed(17)
par(mfrow=c(3,4))
temp <- sapply(c(1,2,5,10,20,50,100,200,500,1000,2000,5000), function(lambda) {
  x <- rpois(20000, lambda)
  v <- sapply(1:floor(lambda + 4*sqrt(lambda)), 
              function(m) var(floor(x/m)*m) - var(x))
  plot(v, type="l", xlab="", ylab="Increased variance", 
       main=toString(lambda), cex.main=.85, col="Blue", lwd=2)
})

Terreni


1
Questa è un'ottima risposta! Probabilmente ci vorrà del tempo per digerire :)
Lubo Antonov,

1
ed è per questo che ho detto "L'uso della funzione floor ... influenza leggermente la varianza anche se in modo più complicato".
Henry,

1
+1 Grazie per la risposta dettagliata. Esistono certamente modi complicati in cui la funzione floor influisce sulla varianza.
Dilip Sarwate,

1
+1 per la simulazione in R con codice --- questo è un bell'esempio di utilizzo sapply()per la simulazione. Grazie.
Assad Ebrahim,

1
xs

12

i=1nλiλ

nλ/nλ/n2

1212n


grazie, non un risultato che posso usare, ma almeno adesso lo so :)
Lubo Antonov

Se i lambda non sono tutti uguali, il risultato non dovrebbe essere più simile a un binomio negativo che a un Poisson (ignorando la parte non intera per il momento)? Cosa mi sto perdendo qui?
gung - Ripristina Monica

2
λiλ1=1,λ2=2,λ3=9λ1=4,λ2=4,λ3=4

10

n iXiXiλiλ=iλi

P{i=1nXi=k}=exp(λ)λkk!,  k=0,1,2,,
Y^=n1i=1nXik/nexp(λ)λkk!Y^Y=Y^m
P{Y=m}=P{1ni=1nXi=m}=exp(λ)i=0n1λmn+i(mn+i)!,  m=0,1,2,,
λn

Y

Grazie per la formulazione rigorosa! Qualche possibilità ti piacerebbe fare una pausa alle formule per media e varianza?
Lubo Antonov,

2
Forse @whuber pubblicherà un link (o una citazione di un libro o di un articolo di giornale) in cui è possibile trovare le formule in forma chiusa per i momenti o scriverà una risposta fornendo le formule stesse, con o senza una derivazione dettagliata.
Dilip Sarwate,

@Dilip La mia affermazione sulle formule chiuse non si basava su nulla di pubblicato, quindi ho pubblicato una risposta separata che indica ciò che avevo in mente e come potrebbe essere utilizzato per comprendere questa situazione.
whuber

3

Y non sarà Poisson. Si noti che le variabili casuali di Poisson assumono valori interi non negativi. Una volta diviso per una costante, si crea una variabile casuale che può avere valori non interi. Avrà ancora la forma del Poisson. È solo che le probabilità discrete possono verificarsi in punti non interi.


Y

@ lucas1024 Non credo, ma non ne sono sicuro.
Michael R. Chernick,

La forma della somma ΣXioè sicuramente Poisson, giusto? anche la sua media e varianza sono identiche. Non c'è qualcosa come un Poisson in scala? Y è solo una variabile di poisson (la somma) che viene ridimensionatan-1
JDav,

@JDav La somma è Poisson con il parametro rate uguale alla somma dei singoli parametri rate. Ma l'OP si ridimensiona di 1 / n e quindi vuole troncare il numero intero appena sotto Y. Non so esattamente cosa faccia alla distribuzione.
Michael R. Chernick,

Il mio commento precedente ha assunto l'indipendenza.
Michael R. Chernick,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.