Teorema del limite centrale per radici quadrate di somme di variabili casuali iid


11

Incuriosito da una domanda su math.stackexchange e indagando empiricamente, mi chiedo la seguente affermazione sulla radice quadrata delle somme di variabili casuali iid.

Supponiamo che X1,X2,,Xn siano variabili casuali iid con media nulla diversa da zero μ e varianza σ2 e Y=i=1nXi . Il teorema del limite centrale dice Ynμnσ2 d N(0,1)comenaumenta.

Se Z=|Y|, posso anche dire qualcosa comeZn|μ|σ24|μ|σ24|μ| d N(0,1)comenaumenta?

Ad esempio, supponiamo che Xi siano Bernoulli con media p e varianza p(1p) , quindi Y è binomiale e posso simularlo in R, diciamo con p=13 :

set.seed(1)
cases <- 100000
n <- 1000
p <- 1/3
Y <- rbinom(cases, size=n, prob=p)
Z <- sqrt(abs(Y))

che fornisce approssimativamente la media e la varianza sperate per Z

> c(mean(Z), sqrt(n*p - (1-p)/4))
[1] 18.25229 18.25285
> c(var(Z), (1-p)/4)
[1] 0.1680012 0.1666667

e un diagramma QQ che sembra vicino a gaussiano

qqnorm(Z)

inserisci qui la descrizione dell'immagine


1
@MichaelM: Grazie per quei commenti. Avevo iniziato con non negativo, ma pensavo che il comportamento intuitivo asintotico che descrivessi consentisse una generalizzazione a più distribuzioni. Le mie sorprese furono (a) la varianza della radice quadrata della somma apparentemente tendente a una costante non dipendente da n e (b) l'apparizione di una distribuzione che sembra molto vicina a Gaussiana. Un contro-esempio sarebbe il benvenuto, ma quando ho provato altri casi che inizialmente sembravano non gaussiani, l'aumento di n sembrava ulteriormente riportare la distribuzione a un risultato di tipo CLT. Xinn
Henry,

Un corollario di questo è il quadrato radice-media (o media quadratica) delle variabili casuali iid opportunamente ridimensionate (moltiplicate per come con una media aritmetica) converge anche in una distribuzione gaussiana a condizione che il4° momento della distribuzione sottostante sia finito. n4
Henry,

3
Solo un breve commento: l'affermazione è un caso speciale del metodo Delta, vedi Teorema 5.5.24 nel libro "Inferenza statistica" di Casella & Berger.
Michael M,

@Michael: Forse vedi qualcosa che non sono in questo momento, ma non penso che questo particolare problema si adatti alle ipotesi del metodo Delta classico (ad esempio, come affermato nel teorema a cui fai riferimento). Si noti che non converge nella distribuzione (non banalmente su R ) e quindi "applicando il metodo Delta con g ( y ) = YR"non soddisfa i requisiti richiesti. Tuttavia, come dimostra la risposta di S. Catterall, fornisce un'euristica utile che porta alla risposta corretta.g(y)=|y|
Cardinale

(Credo che potresti adattare la prova del metodo Delta a casi simili a quelli sopra descritti al fine di rendere pienamente rigoroso l'euristico sopra menzionato.)
Cardinale

Risposte:


14

La convergenza con un gaussiano è davvero un fenomeno generale.

Supponiamo che sono variabili casuali IID con media μ > 0 e varianza σ 2 e definiscono le somme Y n = n i = 1 X i . Risolvi un numero αX1,X2,X3,...μ>0σ2Yn=i=1nXiα . Il solito teorema del limite centrale ci dice che comen, doveΦè il cdf normale standard. Tuttavia, la continuità del cdf limitante implica che abbiamo ancheP(Yn-nμP(Ynnμσnα)Φ(α)nΦperché il termine aggiuntivo sul lato destro della disuguaglianza tende a zero. Riorganizzare questa espressione porta aP(Yn(ασ

P(Ynnμσnα+α2σ24μσn)Φ(α)
P(Yn(ασ2μ+nμ)2)Φ(α)

Prendendo le radici quadrate e notando che implica che P ( Y n < 0 ) 0 , otteniamo P (μ>0P(Yn<0)0In altre parole,

P(|Yn|ασ2μ+nμ)Φ(α)
. Questo risultato dimostra la convergenza con un gaussiano nel limite comen.|Yn|nμσ/2μdN(0,1)n

Questo significa che è una buona approssimazione diE[nμperngrande? Bene, possiamo fare di meglio. Come osserva @Henry, supponendo che tutto sia positivo, possiamo usareE[|Yn|]n, insieme aE[Yn]=nμe l'approssimazioneE[Yn]=E[Yn]Var(Yn)E[Yn]=nμVar(Yn)σ24μE[|Yn|]nμσ24μ

|Yn|nμσ24μσ/2μdN(0,1)
nμσ24μnμ0n .

nμnμσ24μ0n

nμnμkk|Yn|nμkσ/2μN(0,1)nnμσ24μ

Var(Z)=E[Z2](E[Z])2E[Z]=E[Z2]Var(Z)E[Z2]=E[Y]=nμ|Yn|nμσ/2μVar(Z)σ24μE[Z]nμσ24μ

Ok, grazie, ho provato a coprire questo nella mia risposta ora.
S. Catterall Ripristina Monica il
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.