Ennesima questione del teorema del limite centrale


11

Sia una sequenza di variabili casuali di Bernoulli indipendenti con Imposta Mostra che converge nella distribuzione alla variabile normale standard come tende all'infinito.P { X k = 1 } = 1 - P { X k = 0 } = 1{Xn:n1}Sn= n k=1(Xk-1

P{Xk=1}=1P{Xk=0}=1k.
Sn
Sn=k=1n(Xk1k), Bn2=k=1nk1k2
ZnSnBnZn

Il mio tentativo è di usare il CLT Lyapunov, quindi dobbiamo mostrare che esiste un tale che δ>0

limn1Bn2+δk=1nE[|Xk1k|2+δ]=0.

Quindi imposta δ=1

k=1nE|Xkk1|3=k=1n(1k3k2+4k32k4)
e
Bn3=(k=1n1k1k2)(k=1n1k1k2)

Valutando le n grandi sul computer, mostra come entrambi k=1nE|Xkk1|3 e Bn3 come da n . Ma Bn3 aumenta più velocemente di Bn2 quindi k=1nE|Xkk1|3Bn30 . Qualcuno può aiutarmi a provare questa convergenza?


7
Questo è l'esempio 27.3 di probabilità e misura di Patrick Billingsley.
Zhanxiong,

Risposte:


10

Può essere istruttivo dimostrare questo risultato dai primi principi e risultati di base , sfruttando le proprietà delle funzioni di generazione cumulativa (esattamente come nelle prove standard del Teorema del limite centrale). Ci richiede di capire il tasso di crescita dei numeri armonici generalizzati per Questi tassi di crescita sono ben noti e facilmente ottenibili rispetto agli integrali : convergono per e divergono altrimenti logaritmicamente per .

H(n,s)=k=1nks
s=1,2,.1nxsdxs>1s=1

Sia e . Per definizione, la funzione di generazione cumulativa (cgf) di èn21kn(Xk1/k)/Bn

ψk,n(t)=logE(exp(Xk1/kBnt))=tkBn+log(1+1+exp(t/Bn)k).

L'espansione in serie del lato destro, ottenuta dall'espansione di attorno a , assume la formalog(1+z)z=0

ψk,n(t)=(k1)2k2Bn2t2+k23k+26k3Bn3t3++kj1±(j1)!j!kjBnjtj+.

I numeratori delle frazioni sono polinomi in con il termine principale . Perché l'espansione del registro converge assolutamente per , questa espansione converge assolutamente quandokkj1|1+exp(t/Bn)k|<1

|exp(t/Bn)1|<k.

(Nel caso converge ovunque.) Per fissi e valori crescenti di , la (ovvia) divergenza di implica che il dominio della convergenza assoluta diventa arbitrariamente grande. Pertanto, per qualsiasi fissa e sufficientemente grande , questa espansione converge assolutamente.k=1knBntn

Per sufficientemente grande , quindi, possiamo quindi sommare l'individuo su termine per termine in poteri di per ottenere il cgf di ,nψk,nktSn/Bn

ψn(t)=k=1nψk,n(t)=12t2++1Bnj(k=1n(k1±(j1)!kj))tjj+.

Prendere i termini nelle somme sopra una alla volta ci impone di valutare espressioni proporzionali ak

b(s,j)=1Bnjk=1nks

per e . Usando gli asintotici dei numeri armonici generalizzati menzionati nell'introduzione, ne consegue facilmentej3s=1,2,,j

Bn2=H(n,1)H(n,2)log(n)

quello

b(1,j)(log(n))1j/20

e (per )s>1

b(s,j)(log(n))j/20

come cresce di grandi dimensioni. Di conseguenza tutti i termini nell'espansione di oltre convergono in zero, da cui converge in per qualsiasi valore di . Poiché la convergenza del cgf implica la convergenza della funzione caratteristica, concludiamo dal Teorema di continuità di Levy che avvicina a una variabile casuale il cui cgf è 2/2 : questa è la variabile normale standard, QED .nψn(t)t2ψn(t)t2/2tSn/Bnt2/2


Questa analisi rivela quanto sia delicata la convergenza: mentre in molte versioni del Teorema del limite centrale il coefficiente di è (per ), qui il coefficiente è solo : la convergenza è molto più lenta, in questo senso la sequenza di variabili standardizzate "appena" diventa Normale.tjO(n1j/2)j3O(((log(n))1j/2)

Possiamo vedere questa lenta convergenza in una serie di simulazioni. Gli istogrammi mostrano iterazioni indipendenti per quattro valori di . Le curve rosse sono grafici delle funzioni di densità normale standard per riferimento visivo. Sebbene vi sia evidentemente una graduale tendenza alla normalità, anche a (dove è ancora considerevole) rimane una non-normalità apprezzabile, come evidenziato dall'asimmetria (uguale a in questo campione). (Non sorprende che l'asimmetria di questo istogramma sia vicina a , perché è esattamente quello che è il termine nel cgf.)105nn=1000(log(n))1/20.380.35(log(n))1/2t3

Figura: istogrammi per n = 30, 100, 300, 1000

Ecco il Rcodice per coloro che desiderano sperimentare ulteriormente.

set.seed(17)
par(mfrow=c(1,4))
n.iter <- 1e5
for(n in c(30, 100, 300, 1000)) {
  B.n <- sqrt(sum(rev((((1:n)-1) / (1:n)^2))))
  x <- matrix(rbinom(n*n.iter, 1, 1/(1:n)), nrow=n, byrow=FALSE)
  z <- colSums(x - 1/(1:n)) / B.n
  hist(z, main=paste("n =", n), freq=FALSE, ylim=c(0, 1/2))
  curve(dnorm(x), add=TRUE, col="Red", lwd=2)
}

6

Hai già un'ottima risposta. Se vuoi completare anche la tua prova, puoi argomentare come segue:

Poiché converge per tutti e diverge per ( qui ), possiamo scriverek=1n1/kii>1i=1

S(n):=k=1n(1k3k2+4k33k4)=k=1n1k+O(1).

Con lo stesso argomento,

Bn2=k=1n1k+O(1).

Di conseguenza, e, quindi,S(n)/Bn2=O(1)

S(n)/Bn3=O(1)(Bn2)1/20,

che è quello che volevamo mostrare.


2

Innanzitutto le variabili casuali non vengono distribuite in modo identico se le distribuzioni dipendono da ;)k

Inoltre non tua notazione come:Bn

  • le lettere maiuscole sono generalmente riservate a variabili casuali.
  • è solo la somma delle varianze, quindi vorrei usare una notazione che coinvolge un simbolo per renderlo ovvio.σ

Quindi per quanto riguarda la domanda non so se si tratta di un esercizio o di una ricerca e quali strumenti ti è permesso usare. Se non stai cercando di provare nuovamente teoremi noti, direi solo che è un teorema limite centrale per camper indipendenti non identicamente distribuiti ma uniformemente limitati e lo chiamerei un giorno. Non ho una buona fonte a portata di mano, ma non dovrebbe essere troppo difficile trovarne una, per esempio guarda /mathpro/29508/is-there-a-central-limit-theorem- per-limitato-non-identicamente-distribuito-casuale .

Modifica: Mio male, ovviamente la condizione delimitata uniformemente non è sufficiente, hai anche bisogno di

k=1nσk2
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.