Mostra stima converge in percentile attraverso le statistiche degli ordini

Sia una sequenza di variabili casuali iid campionate da una distribuzione stabile alfa , con parametri $X_1, X_2, \ldots, X_{3n}$ . $\alpha = 1.5, \; \beta = 0, \; c = 1.0, \; \mu = 1.0$

Consideriamo ora la sequenza , dove , per . $Y_1, Y_2, \ldots, Y_{n}$ $Y_{j+1} = X_{3j+1}X_{3j+2}X_{3j+3} - 1$ $j=0, \ldots, n-1$

Voglio stimare lo percentile. $0.01-$

La mia idea è quella di eseguire una sorta di simulazione Monte-Carlo:

l = 1;
while(l < max_iterations)
{
  Generate $X_1, X_2, \ldots, X_{3n}$ and compute $Y_1, Y_2, \ldots, Y_{n}$;
  Compute $0.01-$percentile of current repetition;
  Compute mean $0.01-$percentile of all the iterations performed;
  Compute variance of $0.01-$percentile of all the iterations performed;
  Calculate confidence interval for the estimate of the $0.01-$percentile;

  if(confidence interval is small enough)
    break;

}

Chiamando la media di tutto il campione percentili calcolato per essere e la loro varianza , per calcolare l'intervallo di confidenza appropriato per , ricorro al modulo di forza del teorema del limite centrale : $0.01-$ $\hat{\mu}_n$ $\hat{\sigma}^{2}_{n}$ $\mu$

Sia una sequenza di variabili casuali iid con e . Definire la media campione . $X_1, X_2, \ldots$ $E \left[ X_i \right] = \mu$ $0 < V \left[ X_i \right] = \sigma^2 < \infty$ $\hat{\mu}_n = (1/n) \sum_{i=1}^n X_i$ ha la limitazione di distribuzione normale standard, cioè $(\hat{\mu}_n - \mu) / \sqrt{\sigma^{2}/n}$
$\frac{{\hat{μ}}_{n} - μ}{\sqrt{σ^{2} / n}} \overset{n \to \infty}{⟶} N (0, 1) .$ $\frac{\hat{\mu}_n - \mu}{\sqrt{\sigma^{2}/n}} \overset{n \rightarrow \infty} \longrightarrow N(0,1).$

e il teorema di Slutksy per concludere che

\sqrt{n} \frac{{\hat{μ}}_{n} - μ}{\sqrt{{\hat{σ}}_{n}^{2}}} \overset{n \to \infty}{⟶} N (0, 1) .

$\sqrt{n} \frac{\hat{\mu}_n - \mu}{\sqrt{\hat{\sigma}^{2}_{n}}} \overset{n \rightarrow \infty} \longrightarrow N(0,1).$

Quindi un intervallo di confidenza per è $(1-\alpha)\times 100\%$ $\mu$

doveè il-quantile della distribuzione normale standard.

I_{α} = [{\hat{μ}}_{n} - z_{1 - α / 2} \sqrt{\frac{{\hat{σ}}_{n}^{2}}{n}}, {\hat{μ}}_{n} + z_{1 - α / 2} \sqrt{\frac{{\hat{σ}}_{n}^{2}}{n}}],

$I_{\alpha} = \left[\hat{\mu}_n - z_{1- \alpha / 2} \sqrt{\frac{\hat{\sigma}^{2}_{n}}{n}} , \hat{\mu}_n + z_{1- \alpha / 2} \sqrt{\frac{\hat{\sigma}^{2}_{n}}{n}} \right],$

z_{1 - α / 2}

$z_{1- \alpha / 2}$

(1 - α / 2)

$(1- \alpha / 2)$

Domande:

1) Il mio approccio è corretto? Come posso giustificare l'applicazione del CLT? Voglio dire, come posso dimostrare che la varianza è limitata? (Devo guardare la varianza di ? Perché non penso che sia finito ...) $Y_j$

$0.01-$ $0.01-$

— maya
fonte

Tutti i metodi applicati ai campioni mediani su stats.stackexchange.com/questions/45124 si applicano anche ad altri percentili. In effetti, la tua domanda è identica a quella ma sostituisce semplicemente il 50o percentile con il 1o (o 0,01 forse?) Percentile.

— whuber

@whuber, la tua risposta a questa domanda è estremamente buona. tuttavia, Glen_b afferma, alla fine del suo post (la risposta accettata), che la normalità approssimativa "non vale per quantili estremi, perché il CLT non entra in gioco lì (la media di Z non sarà asintoticamente normale ). Hai bisogno di una teoria diversa per valori estremi ". Quanto dovrei preoccuparmi di questa affermazione?

— Maya,

Credo che non intendesse davvero quantili estremi , ma solo gli estremi stessi. (In effetti, ha corretto quel lasso alla fine della stessa frase, riferendosi ad essi come "valori estremi"). La distinzione è che un quantile estremo, come il 0,01 percentile (che segna il 1/10000 di fondo del distribuzione), nel limite, si stabilizzerà perché sempre più dati in un campione scenderanno ancora al di sotto e sempre più cadranno al di sopra di quel percentile. Con un estremo (come il massimo o il minimo) che non è più il caso.

— whuber

Questo è un problema che dovrebbe essere risolto in generale usando la teoria del processo empirico. Qualche aiuto sul tuo livello di formazione sarebbe utile.

— AdamO,

$Y$ $X$ $\alpha=3/2$ $\mu$ $Y$ $\sigma^2$ $X_i$

\begin{aligned} σ^{2} = Var (Y) & = E (Y^{2}) - E (Y)^{2} \\ = E (X_{1}^{2} X_{2}^{2} X_{3}^{2}) - E (X_{1} X_{2} X_{3})^{2} \\ = E (X^{2})^{3} - {(E (X)^{3})}^{2} \\ = {(Var (X) + E (X)^{2})}^{3} - μ^{6} \\ = {(Var (X) + μ^{2})}^{3} - μ^{6} . \end{aligned}

$\eqalign{ \sigma^2 = \operatorname{Var}(Y) &= \mathbb{E}(Y^2) - \mathbb{E}(Y)^2 \\ &= \mathbb{E}(X_1^2X_2^2X_3^2) - \mathbb{E}(X_1X_2X_3)^2 \\ &= \mathbb{E}(X^2)^3 - \left(\mathbb{E}(X)^3\right)^2 \\ &= \left(\operatorname{Var}(X) + \mathbb{E}(X)^2\right)^3 - \mu^6 \\ &= \left(\operatorname{Var}(X) + \mu^2\right)^3 - \mu^6. }$

$\operatorname{Var}(X)$ $\operatorname{Var}(X)$

Passiamo alla seconda domanda.

Qualsiasi quantile campione converge nel quantile reale man mano che il campione cresce. I prossimi paragrafi dimostrano questo punto generale.

$q=0.01$ $0$ $1$ $F$ $Z_q=F^{-1}(q)$ $q^{\text{th}}$

$F^{-1}$ $\epsilon\gt 0$ $q_-\lt q$ $q_+\gt q$

F (Z_{q} - ϵ) = q_{-}, F (Z_{q} + ϵ) = q_{+},

$F(Z_q - \epsilon) = q_-,\quad F(Z_q + \epsilon) = q_+,$

$\epsilon\to 0$ $[q_-, q_+]$ $\{q\}$

$n$ $Z_{q_-}$ $(q_-, n)$ $q_-$ $Z_{q_-}$ $n$ $Z_{q_-}$ $nq_-$ $nq_-(1-q_-)$ $\Phi$ $nq$

1 - Φ (\frac{n q - n q_{-}}{\sqrt{n q_{-} (1 - q_{-})}}) = 1 - Φ (\sqrt{n} \frac{q - q_{-}}{\sqrt{q_{-} (1 - q_{-})}}) .

$1-\Phi\left(\frac{nq - nq_-}{\sqrt{nq_-(1-q_-)}}\right) = 1-\Phi\left(\sqrt{n}\frac{q - q_-}{\sqrt{q_-(1-q_-)}}\right).$

$\Phi$ $\sqrt{n}$ $n$ $\Phi$ $1$

$nq$ $Z_{q_-}$ $nq$ $Z_{q_+}$ $q$ $Z_q-\epsilon$ $Z_q+\epsilon$

$\epsilon$ $1-\alpha$ $n$ $nq$ $1-\alpha$ $\epsilon$ $Z_q$

$q=0.50$

$q=0.01$ $Y$ $n=300$ $Y$

library(stabledist)
n <- 3e2
q <- 0.01
n.sim <- 1e3

Y.q <- replicate(n.sim, {
  Y <- apply(matrix(rstable(3*n, 3/2, 0, 1, 1), nrow=3), 2, prod) - 1
  log(-quantile(Y, 0.01))
})
m <- median(-exp(Y.q))
hist(Y.q, freq=FALSE, 
     main=paste("Histogram of the", q, "quantile of Y for", n.sim, "iterations" ),
     xlab="Log(-Y_q)",
     sub=paste("Median is", signif(m, 4), 
               "Negative log is", signif(log(-m), 4)),
     cex.sub=0.8)
abline(v=log(-m), col="Red", lwd=2)

— whuber
fonte