Ho la seguente domanda per un corso a cui sto lavorando:
Effettuare uno studio Monte Carlo per stimare le probabilità di copertura dell'intervallo di confidenza bootstrap normale standard e dell'intervallo di confidenza bootstrap di base. Campionare da una popolazione normale e verificare i tassi di copertura empirica per la media del campione.
Le probabilità di copertura per il normale CI di bootstrap standard sono facili:
n = 1000;
alpha = c(0.025, 0.975);
x = rnorm(n, 0, 1);
mu = mean(x);
sqrt.n = sqrt(n);
LNorm = numeric(B);
UNorm = numeric(B);
for(j in 1:B)
{
smpl = x[sample(1:n, size = n, replace = TRUE)];
xbar = mean(smpl);
s = sd(smpl);
LNorm[j] = xbar + qnorm(alpha[1]) * (s / sqrt.n);
UNorm[j] = xbar + qnorm(alpha[2]) * (s / sqrt.n);
}
mean(LNorm < 0 & UNorm > 0); # Approximates to 0.95
# NOTE: it is not good enough to look at overall coverage
# Must compute separately for each tail
Da quanto mi è stato insegnato per questo corso, l' intervallo di confidenza di base del bootstrap può essere calcolato in questo modo:
# Using x from previous...
R = boot(data = x, R=1000, statistic = function(x, i){ mean(x[i]); });
result = 2 * mu - quantile(R$t, alpha, type=1);
Ha senso. Quello che non capisco è come calcolare le probabilità di copertura per la CI di bootstrap di base. Comprendo che la probabilità di copertura rappresenterebbe il numero di volte in cui l'IC contiene il valore reale (in questo caso mu
). Eseguo semplicemente la boot
funzione più volte?
Come posso affrontare questa domanda in modo diverso?
smpl = x[sample(1:n, size = 100, replace = TRUE)];
può essere semplificato smpl = sample(x, size=100, replace=TRUE)
.
mu
è 0. Il normale CI funziona bene, è il CI di bootstrap di base con cui ho difficoltà.
size=100
un errore di battitura? Non credo che tu stia ottenendo i limiti superiore e inferiore giusti poiché la dimensione del campione implicita sembra essere 1000 quando calcoli i tuoi EC nel ciclo (dal momento che usisqrt.n
nel calcolo). Inoltre, perché stai confrontandomu
e non 0 direttamente (quest'ultimo è la vera media)?