Limitazione della distribuzione di cui è normale


8

Sia una sequenza di variabili casuali iid . Definire e per . Trova la distribuzione limitante di \ frac1n \ sum_ {k = 1} ^ {n} | S_ {k-1} | (X_k ^ 2 - 1)(Xn)N(0,1)S0=0Sn=k=1nXkn1

1nk=1n|Sk1|(Xk21)

Questo problema proviene da un libro di problemi sulla teoria della probabilità, nel capitolo sul Teorema del limite centrale.

Poiché Sk1 e Xk sono indipendenti, E(|Sk1|(Xk21))=0 e

V(|Sk1|(Xk21))=E(Sk12(Xk21)2)=E(Sk12)E(Xk21)2)=2(k1)

Nota che |Sk1|(Xk21) sono chiaramente indipendenti. Il problema è da Problemi di probabilità di Shiryaev , che si basa sul libro di testo dello stesso autore. Il libro di testo non sembra coprire il CLT per variabili correlate. Non so se c'è una sequenza di missaggio fissa che si nasconde da qualche parte ...

Ho eseguito simulazioni per avere un'idea della risposta

import numpy as np
import scipy as sc
import scipy.stats as stats
import matplotlib.pyplot as plt

n = 20000 #summation index
m = 2000 #number of samples

X = np.random.normal(size=(m,n))
sums = np.cumsum(X, axis=1)
sums = np.delete(sums, -1, 1)
prods = np.delete(X**2-1, 0, 1)*np.abs(sums)
samples = 1/n*np.sum(prods, axis=1)

plt.hist(samples, bins=100, density=True)
x = np.linspace(-6, 6, 100)
plt.plot(x, stats.norm.pdf(x, 0, 1/np.sqrt(2*np.pi)))
plt.show()

Di seguito è riportato un istogramma di 2000 campioni ( n=20.000 ). Sembra abbastanza normalmente distribuito ...

inserisci qui la descrizione dell'immagine


@MartijnWeterings Ho postato questo perché ho riflettuto sul problema per un po 'di tempo e sono bloccato. Probabilmente è tutt'altro che banale ...
Gabriel Romon,

@MartijnWeterings , quindiE(|Sk1|(Xk21))=0V(|Sk1|(Xk21))=E(Sk12(Xk21)2)
Gabriel Romon,

@MartijnWeterings Sì, ho omesso la banale uguaglianza per ...|x|2=x2xR
Gabriel Romon,

L'istogramma nella simulazione è una corrispondenza terribile per la distribuzione normale. Se non sei convinto, calcola la curtosi.
whuber

@MartijnWeterings Sì, ho fatto un'omissione imbarazzante nel codice. L'ho aggiornato, così come l'istogramma, che sembra normale. Hai un'idea del valore esatto della varianza?
Gabriel Romon,

Risposte:


1

Quando simulo la distribuzione ottengo qualcosa che ricorda una distribuzione di Laplace. Ancora meglio sembra essere un q-gausiano (i parametri esatti che dovresti trovare usando la teoria).

Immagino che il tuo libro debba contenere una variazione del CLT che si riferisce a questo (teorema del limite centrale generalizzato q, probabilmente è nella Sezione 7.6 Il teorema del limite centrale per somme di variabili dipendenti , ma non riesco a cercarlo come non hai il libro disponibile).

simulazione

library(qGaussian)
set.seed(1)
Qstore <- c(0) # vector to store result

n <- 10^6  # columns X_i
m <- 10^2  # rows repetitions

pb <- txtProgressBar(title = "progress bar", min = 0,
                     max = 100, style=3)
for (i in 1:100) {  
  # doing this several times because this matrix method takes a lot of memory
  # with smaller numbers n*m it can be done at once

  X <- matrix(rnorm(n*m,0,1),m)
  S <- t(sapply(1:m, FUN = function(x) cumsum(X[x,])))
  S <- cbind(rep(0,m),S[,-n])
  R <- abs(S)*(X^2-1)
  Q <- t(sapply(1:m, FUN = function(x) cumsum(R[x,])))

  Qstore <- c(Qstore,t(Q[,n]))
  setTxtProgressBar(pb, i)
}
close(pb)

# compute histogram 
x <- seq(floor(min(Qstore/n)), ceiling(max(Qstore/n)), 0.2)
h <- hist(Qstore/(n),breaks = x)

# plot simulation
plot( h$mid, h$density, log = "y", xlim=c(-7,7),
      ylab = "log density" , xlab = expression(over(1,n)*sum(abs(S[k-1])*(X[k]^2-1),k==1,n) ) )

# distributions for comparison
lines(x, dnorm(x,0,1),                   col=1, lty=3)      #normal 
lines(x, dexp(abs(x),sqrt(2))/2,         col=1, lty=2)      #laplace
lines(x, qGaussian::dqgauss(x,sqrt(2),0,1/sqrt(2)), col=1, lty=1)      #qgauss

# further plotting
title("10^4 repetitions with n=10^6")
legend(-7,0.6,c("Gaussian", "Laplace", "Q-Gaussian"),col=1, lty=c(3,2,1),cex=0.8)

Per quanto riguarda il contenuto del libro di testo, è meglio che tu veda di persona: Volume 1 , Volume 2 . Il problema dovrebbe richiedere solo materiale coperto nel capitolo 3.4
Gabriel Romon,

@GabrielRomon grazie mille per quei link. Guardandolo, dal mio telefono, non sono riuscito a trovare nulla sulle q-gaussiane o altre distribuzioni limitanti che non sono una distribuzione normale. Quindi o la distribuzione ha una convergenza molto lenta n >> 10 ^ 6 prima di vederla , oppure la domanda non si adatta al capitolo (è dal libro, non sono riuscito a trovare la domanda?). Un grafico dei momenti di ordine superiore (in funzione di n) potrebbe mostrare meglio se la conversione potrebbe ancora avvenire, ma suppongo che questo non sia un tipico caso CLT.
Sesto Empirico

1
Questo è il problema 3.4.14 nel libro dei problemi .
Gabriel Romon,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.