Un confronto dei metodi degli intervalli di confidenza su un esempio di ISL
Il libro "Introduzione all'apprendimento statistico" di Tibshirani, James, Hastie fornisce un esempio a pagina 267 degli intervalli di confidenza per il grado di regressione logistica polinomiale 4 sui dati salariali . Citando il libro:
Modelliamo l'evento binario usando la regressione logistica con un polinomio di grado 4. La probabilità posteriore adattata di stipendio superiore a $ 250.000 è indicata in blu, insieme a un intervallo di confidenza stimato del 95%.w a ge > 250
Di seguito è riportato un breve riepilogo di due metodi per costruire tali intervalli, nonché commenti su come implementarli da zero
Intervalli di trasformazione Wald / Endpoint
- Calcola i limiti superiore e inferiore dell'intervallo di confidenza per la combinazione lineare (utilizzando Wald CI)XTβ
- Applicare una trasformazione monotonica agli endpoint per ottenere le probabilità.F( xTβ)
Poiché è una trasformazione monotonica di x T βPr ( xTβ) = F( xTβ)XTβ
[ Pr ( xTβ)L≤ Pr ( xTβ) ≤ Pr ( xTβ)U] = [ F( xTβ)L≤ F( xTβ) ≤ F( xTβ)U]
Concretamente questo significa calcolare e quindi applicare la trasformazione logit al risultato per ottenere i limiti inferiore e superiore:βTx ± z*SE( βTx )
[ eXTβ- z*SE( xTβ)1 + eXTβ- z*SE( xTβ), eXTβ+ z*SE( xTβ)1 + eXTβ+ z*SE( xTβ), ]
Calcolo dell'errore standard
XTβΣ
Va r ( xTβ) = xTΣ x
XV
X = ⎡⎣⎢⎢⎢⎢⎢11⋮1x1,1x2,1⋮xn,1……⋱…x1,px2,p⋮xn,p⎤⎦⎥⎥⎥⎥⎥ V = ⎡⎣⎢⎢⎢⎢⎢π^1(1−π^1)0⋮00π^2(1−π^2)⋮0……⋱…00⋮π^n(1−π^n)⎤⎦⎥⎥⎥⎥⎥
xi,jjiπ^ii
Σ=(XTVX)−1SE(xTβ)=Var(xTβ)−−−−−−−−√
Gli intervalli di confidenza al 95% per la probabilità prevista possono quindi essere tracciati come
Intervalli di confidenza del metodo Delta
F
Var[F(xTβ^)]≈∇FT Σ ∇F
∇Σ
∂F(xβ)∂β=∂F(xβ)∂xβ∂xβ∂β=xf(xβ)
fF
Var[F(xTβ^)]≈fT xT Σ x f
π(xTβ)
π′(xTβ)=π(xTβ)(1−π(xTβ))
Ora possiamo costruire un intervallo di confidenza usando la varianza calcolata sopra.
C.I.=[Pr(xβ^)−z∗Var[π(xβ^)]−−−−−−−−−√≤Pr(xβ^)+z∗Var[π(xβ^)]−−−−−−−−−√]
In formato vettoriale per il caso multivariato
C.I.=[π(xTβ^)±z∗(π(xTβ^)(1−π(xTβ^)))TxT Var[β^] x π(xTβ^)(1−π(xTβ^))]−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−√
Una conclusione aperta
Uno sguardo ai grafici QQ normali sia per le probabilità che per le probabilità del registro negativo mostra che nessuno dei due è normalmente distribuito. Questo potrebbe spiegare la differenza?
Fonte: