Una generalizzazione della domanda richiede la distribuzione di quando la distribuzione di X è nota e supportata sui numeri naturali. (Nella domanda, X ha una distribuzione di Poisson del parametro λ = λ 1 + λ 2 + ⋯ + λ n e m = n .)Y= ⌊ X/ m⌋XXλ = λ1+ λ2+ ⋯ + λnm = n
La distribuzione di è facilmente determinata dalla distribuzione di m Y , la cui probabilità di generazione di funzione (PGF) può essere determinato in termini di PGF di X . Ecco uno schema della derivazione.Ym YX
Scrivi per il pgf di X , dove (per definizione) p n = Pr ( X = n ) . m Y è costruito da X in modo tale che il suo pgf, q , siap ( x ) = p0+ p1x + ⋯ + pnXn+ ⋯Xpn=Pr(X=n)mYXq
q(x)=(p0+p1+⋯+pm−1)+(pm+pm+1+⋯+p2m−1)xm+⋯+(pnm+pnm+1+⋯+p(n+1)m−1)xnm+⋯.
Perché questo converge assolutamente per , possiamo riorganizzare i termini in una somma di pezzi del modulo|X|≤1
Dm,tp(x)=pt+pt+mxm+⋯+pt +nmxnm+ ⋯
per . La serie di potenze delle funzioni x t D m , t p costituiti da ogni m esimo termine della serie di p partire dalla t th : questo è talvolta chiamato decimazione di p . Le ricerche di Google al momento non forniscono molte informazioni utili sulle decimazioni, quindi per completezza, ecco una derivazione di una formula.t = 0 , 1 , … , m - 1xtDm , tpmesimoptesimop
Lasciate essere qualsiasi primitiva m esima radice di unità; per esempio, prendi ω = exp ( 2 i π / m ) . Quindi segue da ω m = 1 e ∑ m - 1 j = 0 ω j = 0 cheωmesimoω =exp( 2 iπ/ m)ωm= 1Σm - 1j = 0ωj= 0
XtDm , tp ( x ) =1mΣj = 0m - 1ωt jp ( x /ωj) .
Per vedere questo, nota che l'operatore è lineare, quindi è sufficiente controllare la formula sulla base { 1 , x , x 2 , ... , x n , ... } . Applicando il lato destro a x n si ottieneXtDm , t{ 1 , x , x2, ... , xn, ... }Xn
XtDm , t[ xn] = 1mΣj = 0m - 1ωt jXnω- n j= xnmΣj = 0m - 1ω( t - n ) j .
Quando e n differiscono per un multiplo di m , ogni termine nella somma è uguale a 1 e otteniamo x n . Altrimenti, i termini si alternano tra potenze di ω t - n e questi si sommano a zero. Da cui questo operatore conserva tutti i poteri di x congruente a t modulo me uccide tutti gli altri: è proprio la proiezione desiderata.tnm1Xnωt - nXtm
Una formula per segue prontamente cambiando l'ordine della somma e riconoscendo una delle somme come geometrica, scrivendola così in forma chiusa:q
q( x )= ∑t = 0m - 1( Dm , t[ p ] ) ( x )= ∑t = 0m - 1X- t1mΣj = 0m - 1ωt jp ( ω−jx)=1m∑j=0m−1p(ω−jx)∑t=0m−1(ωj/x)t=x(1−x−m)m∑j=0m−1p(ω−jx)x−ωj.
Ad esempio, il pgf di una distribuzione di Poisson del parametro è p ( x ) = exp ( λ ( x - 1 ) ) . Con m = 2 , ω = - 1 e il pgf di 2 Y saràλp(x)=exp(λ(x−1))m=2ω=−12Y
q(x)=x(1−x−2)2∑j=02−1p((−1)−jx)x−(−1)j=x−1/x2(exp(λ(x−1))x−1+exp(λ(−x−1))x+1)=exp(−λ)(sinh(λx)x+cosh(λx)).
Un uso di questo approccio è quello di calcolare i momenti di e m Y . Il valore della k esima derivata della PGF di valutazioni x = 1 è il k esimo momento fattoriale. Il k esima momento è una combinazione lineare dei primi k momenti fattoriali. Usando queste osservazioni troviamo, ad esempio, che per un Poisson distribuito X , la sua media (che è il primo momento fattoriale) è uguale a λ , la media di 2 ⌊ ( X / 2 ) ⌋ è uguale a λXmYkthx=1kthkthkXλ2⌊(X/2)⌋e la media di3⌊(X/3)⌋ èuguale aλ-1+e-3λ/2(sin ( √λ−12+12e- 2 λ3 ⌊ ( X/ 3)⌋:λ - 1 + e−3λ/2(sin(3√λ2)3√+cos(3√λ2))
I mezzi per sono mostrati rispettivamente in blu, rosso e giallo, come funzioni di λ : asintoticamente, la media scende di ( m - 1 ) / 2 rispetto alla media originale di Poisson.m=1,2,3λ(m−1)/2
Formule simili per le varianze possono essere ottenute. (Diventano disordinati quando alza e così vengono omessi. Una cosa che stabiliscono definitivamente è che quando m > 1 nessun multiplo di Y è Poisson: non ha la caratteristica uguaglianza di media e varianza) Ecco un diagramma delle varianze come una funzione di λ per m = 1 , 2 , 3 :mm>1Yλm=1,2,3
È interessante notare che per valori maggiori di aumentano le varianze . Intuitivamente, ciò è dovuto a due fenomeni in competizione: la funzione floor è effettivamente binning gruppi di valori che originariamente erano distinti; questo deve far diminuire la varianza . Allo stesso tempo, come abbiamo visto, anche i mezzi stanno cambiando (perché ogni cestino è rappresentato dal suo valore più piccolo); questo deve far sì che un termine uguale al quadrato della differenza di mezzi venga aggiunto di nuovo. L'aumento della varianza per λ di grandi dimensioni aumenta con valori maggiori di m .λλm
Il comportamento della varianza di con m è sorprendentemente complesso. Terminiamo con una rapida simulazione (in ) che mostra cosa può fare. I grafici mostrano la differenza tra la varianza di m ⌊ X / m ⌋ e la varianza di X per Poisson ha distribuito X con vari valori di λ compresi tra 1 e 5000 . In tutti i casi le trame sembrano aver raggiunto i loro valori asintotici a destra.mYmR
m⌊X/m⌋XXλ15000
set.seed(17)
par(mfrow=c(3,4))
temp <- sapply(c(1,2,5,10,20,50,100,200,500,1000,2000,5000), function(lambda) {
x <- rpois(20000, lambda)
v <- sapply(1:floor(lambda + 4*sqrt(lambda)),
function(m) var(floor(x/m)*m) - var(x))
plot(v, type="l", xlab="", ylab="Increased variance",
main=toString(lambda), cex.main=.85, col="Blue", lwd=2)
})