Mostra stima converge in percentile attraverso le statistiche degli ordini


10

Sia una sequenza di variabili casuali iid campionate da una distribuzione stabile alfa , con parametri α = 1,5 ,X1,X2,,X3n .α=1.5,β=0,c=1.0,μ=1.0

Consideriamo ora la sequenza , dove Y j + 1 = X 3 j + 1 X 3 j + 2 X 3 j + 3 - 1 , per j = 0 , , n - 1 .Y1,Y2,,YnYj+1=X3j+1X3j+2X3j+31j=0,,n1

Voglio stimare lo percentile.0.01

La mia idea è quella di eseguire una sorta di simulazione Monte-Carlo:

l = 1;
while(l < max_iterations)
{
  Generate $X_1, X_2, \ldots, X_{3n}$ and compute $Y_1, Y_2, \ldots, Y_{n}$;
  Compute $0.01-$percentile of current repetition;
  Compute mean $0.01-$percentile of all the iterations performed;
  Compute variance of $0.01-$percentile of all the iterations performed;
  Calculate confidence interval for the estimate of the $0.01-$percentile;

  if(confidence interval is small enough)
    break;

}

Chiamando la media di tutto il campione percentili calcolato per essere μ n e la loro varianza σ 2 n , per calcolare l'intervallo di confidenza appropriato per μ , ricorro al modulo di forza del teorema del limite centrale :0.01μ^nσ^n2μ

Sia una sequenza di variabili casuali iid con E [ X i ] = μ e 0 < V [ X i ] = σ 2 < . Definire la media campione μ n = ( 1 / n ) Σ n i = 1 X i . Poi, ( μ n - μ ) /X1,X2,E[Xi]=μ0<V[Xi]=σ2<μ^n=(1/n)i=1nXi ha la limitazione di distribuzione normale standard, cioè μ n -μ(μ^nμ)/σ2/n

μ^nμσ2/nnN(0,1).

e il teorema di Slutksy per concludere che

nμ^nμσ^n2nN(0,1).

Quindi un intervallo di confidenza per μ è(1α)×100%μ

dovez1-α/2è il(1-α/2)-quantile della distribuzione normale standard.

Iα=[μ^nz1α/2σ^n2n,μ^n+z1α/2σ^n2n],
z1α/2(1α/2)

Domande:

1) Il mio approccio è corretto? Come posso giustificare l'applicazione del CLT? Voglio dire, come posso dimostrare che la varianza è limitata? (Devo guardare la varianza di ? Perché non penso che sia finito ...)Yj

0.010.01


3
Tutti i metodi applicati ai campioni mediani su stats.stackexchange.com/questions/45124 si applicano anche ad altri percentili. In effetti, la tua domanda è identica a quella ma sostituisce semplicemente il 50o percentile con il 1o (o 0,01 forse?) Percentile.
whuber

@whuber, la tua risposta a questa domanda è estremamente buona. tuttavia, Glen_b afferma, alla fine del suo post (la risposta accettata), che la normalità approssimativa "non vale per quantili estremi, perché il CLT non entra in gioco lì (la media di Z non sarà asintoticamente normale ). Hai bisogno di una teoria diversa per valori estremi ". Quanto dovrei preoccuparmi di questa affermazione?
Maya,

2
Credo che non intendesse davvero quantili estremi , ma solo gli estremi stessi. (In effetti, ha corretto quel lasso alla fine della stessa frase, riferendosi ad essi come "valori estremi"). La distinzione è che un quantile estremo, come il 0,01 percentile (che segna il 1/10000 di fondo del distribuzione), nel limite, si stabilizzerà perché sempre più dati in un campione scenderanno ancora al di sotto e sempre più cadranno al di sopra di quel percentile. Con un estremo (come il massimo o il minimo) che non è più il caso.
whuber

Questo è un problema che dovrebbe essere risolto in generale usando la teoria del processo empirico. Qualche aiuto sul tuo livello di formazione sarebbe utile.
AdamO,

Risposte:


2

YXα=3/2μYσ2Xi

σ2=Var(Y)=E(Y2)E(Y)2=E(X12X22X32)E(X1X2X3)2=E(X2)3(E(X)3)2=(Var(X)+E(X)2)3μ6=(Var(X)+μ2)3μ6.

Var(X)Var(X)


Passiamo alla seconda domanda.

Qualsiasi quantile campione converge nel quantile reale man mano che il campione cresce. I prossimi paragrafi dimostrano questo punto generale.

q=0.0101FZq=F1(q)qth

F1ϵ>0q<qq+>q

F(Zqϵ)=q,F(Zq+ϵ)=q+,

ϵ0[q,q+]{q}

nZq(q,n)qZqnZqnqnq(1q)Φnq

1Φ(nqnqnq(1q))=1Φ(nqqq(1q)).

ΦnnΦ1

nqZqnqZq+qZqϵZq+ϵ

ϵ1αnnq1αϵZq


q=0.50

Figura: istogramma di 0,01 quantili di Y con n = 300 per 1000 iterazioni

q=0.01Yn=300Y

library(stabledist)
n <- 3e2
q <- 0.01
n.sim <- 1e3

Y.q <- replicate(n.sim, {
  Y <- apply(matrix(rstable(3*n, 3/2, 0, 1, 1), nrow=3), 2, prod) - 1
  log(-quantile(Y, 0.01))
})
m <- median(-exp(Y.q))
hist(Y.q, freq=FALSE, 
     main=paste("Histogram of the", q, "quantile of Y for", n.sim, "iterations" ),
     xlab="Log(-Y_q)",
     sub=paste("Median is", signif(m, 4), 
               "Negative log is", signif(log(-m), 4)),
     cex.sub=0.8)
abline(v=log(-m), col="Red", lwd=2)
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.