Bande di confidenza per la linea QQ

Questa domanda non riguarda specificamente R, ma ho scelto di usarla Rper illustrarla.

Considera il codice per produrre bande di confidenza attorno a una (normale) linea qq:

library(car)
library(MASS)
b0<-lm(deaths~.,data=road)
qqPlot(b0$resid,pch=16,line="robust")

Sto cercando una spiegazione di (o alternativa un collegamento a un documento cartaceo / online che spieghi) come sono costruite queste bande di confidenza (ho visto un riferimento a Fox 2002 nei file della guida di R, ma purtroppo non ho questo libro a portata di mano).

La mia domanda sarà resa più precisa con un esempio. Ecco come Rcalcola questi particolari elementi della configurazione (ho abbreviato / semplificato il codice utilizzato in car::qqPlot)

x<-b0$resid
good<-!is.na(x)
ord<-order(x[good])
ord.x<-x[good][ord]
n<-length(ord.x)
P<-ppoints(n)
z<-qnorm(P)
plot(z,ord.x,type="n")
coef<-coef(rlm(ord.x~z))
a<-coef[1]
b<-coef[2]
abline(a,b,col="red",lwd=2)
conf<-0.95
zz<-qnorm(1-(1-conf)/2)
SE<-(b/dnorm(z))*sqrt(P*(1-P)/n)     #[WHY?]
fit.value<-a+b*z
upper<-fit.value+zz*SE
lower<-fit.value-zz*SE
lines(z,upper,lty=2,lwd=2,col="red")
lines(z,lower,lty=2,lwd=2,col="red")

La domanda è: qual è la giustificazione per la formula utilizzata per calcolare questi SE (ad esempio la linea SE<-(b/dnorm(z))*sqrt(P*(1-P)/n)).

FWIW questa formula è molto diversa dalla formula delle solite bande di confidenza utilizzate nella regressione lineare

confidence-interval linear-model qq-plot

— user603
fonte

Mi aspetto che abbia a che fare con la distribuzione delle statistiche sugli ordini e in particolare il risultato asintotico :

f_{X_{(K)}} (X) = \frac{n!}{(K - 1)! (n - K)!} [F_{X} (X)]^{K - 1} [1 - F_{X} (X)]^{n - K} f_{X} (X)

$f_{X_{(k)}}(x) =\frac{n!}{(k-1)!(n-k)!}[F_X(x)]^{k-1}[1-F_X(x)]^{n-k} f_X(x)$

X_{(⌈ n p ⌉)} ~ UN N (F^{- 1} (p), \frac{p (1 - p)}{n [f (F^{- 1} (p))]^{2}})

$X_{(\lceil np \rceil)} \sim AN\left(F^{-1}(p),\frac{p(1-p)}{n[f(F^{-1}(p))]^2}\right)$

— Glen_b -Reinstate Monica

@Glen_b ha ragione. John Fox scrive alle pagine 35-36: "L'errore standard della statistica dell'ordine è dove è la funzione di densità di probabilità corrispondente al CDF . I valori lungo la linea adattata sono dati da . Pertanto, una "busta" di confidenza approssimativa al 95% attorno alla linea adattata è . "

X_{(i)}

$X_{(i)}$

S E (X_{(i)}) = \frac{\hat{σ}}{p (z_{i})} \sqrt{\frac{P_{i} (1 - P_{i})}{n}}

$\mathrm{SE}(X_{(i)})=\frac{\hat{\sigma}}{p(z_i)}\sqrt{\frac{P_i(1-P_i)}{n}}$

p (z)

$p(z)$

P (z)

$P(z)$

{\hat{X}}_{(i)} = \hat{μ} + \hat{σ} z_{i}

$\widehat{X}_{(i)}=\hat{\mu}+\hat{\sigma}z_{i}$

{\hat{X}}_{(i)} \pm 2 \times S E (X_{(i)})

$\widehat{X}_{(i)}\pm 2\times \mathrm{SE}(X_{(i)})$

— COOLSerdash

Penso che l'unica cosa che resta da vedere è che è stimato da nell'equazione fornita da COOLSerdash.

f (F^{- 1} (p))

$f(F^{-1}(p))$

(p (z_{i}) / \hat{σ})

$(p(z_i)/\hat{\sigma})$

— Glen_b -Restate Monica

Ha a che fare con la distribuzione delle statistiche dell'ordine e in particolare il risultato asintotico :

f_{X_{(k)}} (x) = \frac{n!}{(k - 1)! (n - k)!} [F_{X} (x)]^{k - 1} [1 - F_{X} (x)]^{n - k} f_{X} (x)

$f_{X_{(k)}}(x) =\frac{n!}{(k-1)!(n-k)!}[F_X(x)]^{k-1}[1-F_X(x)]^{n-k} f_X(x)$

X_{(⌈ n p ⌉)} \sim A N (F^{- 1} (p), \frac{p (1 - p)}{n [f (F^{- 1} (p))]^{2}})

$X_{(\lceil np \rceil)} \sim AN\left(F^{-1}(p),\frac{p(1-p)}{n[f(F^{-1}(p))]^2}\right)$

Come menziona COOLSerdash nei commenti, John Fox [1] scrive alle pagine 35-36:

L'errore standard della statistica dell'ordine è dove è la funzione di densità di probabilità corrispondente al CDF . I valori lungo la linea adattata sono dati da . Una "busta" di confidenza approssimativa del 95% attorno alla linea adattata è quindi . $X_{(i)}$
$S E (X_{(i)}) = \frac{\hat{σ}}{p (z_{i})} \sqrt{\frac{P_{i} (1 - P_{i})}{n}}$ $\mathrm{SE}(X_{(i)})=\frac{\hat{\sigma}}{p(z_i)}\sqrt{\frac{P_i(1-P_i)}{n}}$ $p(z)$ $P(z)$ $\widehat{X}_{(i)}=\hat{\mu}+\hat{\sigma}z_{i}$ $\widehat{X}_{(i)}\pm 2\times \mathrm{SE}(X_{(i)})$

Quindi dobbiamo solo riconoscere che è stimato da . $f(F^{-1}(p))$ $(p(z_i)/\hat{\sigma})$

[1] Fox, J. (2008),
Analisi di regressione applicata e modelli lineari generalizzati, 2a edizione. ,
Sage Publications, Inc

— Glen_b -Restate Monica
fonte