La tua domanda potrebbe venire dal fatto che hai a che fare con Rapporti di probabilità e probabilità che inizialmente confonde. Poiché il modello logistico è una trasformazione non lineare del calcolo gli intervalli di confidenza non sono così semplici.βTx
sfondo
Ricordalo per il modello di regressione logistica
Probabilità di : p = e α + β 1 x 1 + β 2 x 2(Y=1)p=eα+β1x1+β2x21+eα+β1x1+β2x2
Probabilità di : ( p(Y= 1 )(p1−p)=eα+β1x1+β2x2
Log Probabilità di : log ( p(Y=1)log(p1−p)=α+β1x1+β2x2
Considera il caso in cui hai un aumento di una unità nella variabile , ovvero x 1 + 1 , quindi le nuove probabilità sonox1x1+1
Odds(Y=1)=eα+β1(x1+1)+β2x2=eα+β1x1+β1+β2x2
- Odds Ratio (OR) sono quindi
Odds(x1+1)Odds(x1)=eα+β1(x1+1)+β2x2eα+β1x1+β2x2=eβ1
Interpretazione dei coefficienti
Come interpreteresti il valore del coefficiente ? Supponendo che tutto il resto rimanga fisso:βj
- Per ogni aumento di unità in il rapporto log-odds aumenta di β j .Xjβj
- Per ogni aumento di unità in il rapporto di probabilità aumenta di e β j .Xjeβj
- Per ogni aumento di da k a k + Δ il rapporto di probabilità aumenta di e β j ΔXjkk+ΔeβjΔ
- Se il coefficiente è negativo, un aumento di porta a una riduzione del rapporto di probabilità.xj
Intervalli di confidenza per un singolo parametro βj
Devo solo usare ? O devo convertire la SE usando un approccio descritto qui?1.96∗SE
Poiché il parametro è stimato utilizzando la stima della probabilità massima, la teoria MLE ci dice che è asintoticamente normale e quindi possiamo usare il grande intervallo di confidenza di Wald per ottenere il solitoβj
βj±z∗SE(βj)
Ciò fornisce un intervallo di confidenza sul rapporto probabilità-log. L'uso della proprietà di invarianza dell'MLE ci consente di esponenziare per ottenere
eβj±z∗SE(βj)
che è un intervallo di confidenza sul rapporto di probabilità. Si noti che questi intervalli sono solo per un singolo parametro.
Se volessi capire l'errore standard per entrambe le variabili come lo considererei?
Se si includono più parametri è possibile utilizzare la procedura Bonferroni, altrimenti per tutti i parametri è possibile utilizzare l'intervallo di confidenza per le stime di probabilità
Procedura Bonferroni per diversi parametri
Se i parametri devono essere stimati con un coefficiente di confidenza familiare di circa 1 - α , i limiti di confidenza di Bonferroni congiunti sonog1−α
βg±z(1−α2g)SE(βg)
Intervalli di confidenza per le stime di probabilità
pPr(pL≤p≤pU)=.95
Un approccio chiamato trasformazione dell'endpoint procede come segue:
Pr(xTβ)=F(xTβ)xTβ
[Pr(xTβ)L≤Pr(xTβ)≤Pr(xTβ)U]=[F(xTβ)L≤F(xTβ)≤F(xTβ)U]
Concretely this means computing βTx±z∗SE(βTx) and then applying the logit transform to the result to get the lower and upper bounds:
[exTβ−z∗SE(xTβ)1+exTβ−z∗SE(xTβ),exTβ+z∗SE(xTβ)1+exTβ+z∗SE(xTβ),]
The estimated approximate variance of xTβ can be calculated using the covariance matrix of the regression coefficients using
Var(xTβ)=xTΣx
The advantage of this method is that the bounds cannot be outside the range (0,1)
There are several other approaches as well, using the delta method, bootstrapping etc.. which each have their own assumptions, advantages and limits.
Sources and info
My favorite book on this topic is "Applied Linear Statistical Models" by Kutner, Neter, Li, Chapter 14
Otherwise here are a few online sources: