Ho creato una regressione logistica utilizzando il seguente codice:
full.model.f = lm(Ft_45 ~ ., LOG_D)
base.model.f = lm(Ft_45 ~ IP_util_E2pl_m02_flg)
step(base.model.f, scope=list(upper=full.model.f, lower=~1),
direction="forward", trace=FALSE)
Ho quindi usato l'output per creare un modello finale:
final.model.f = lm(Ft_45 ~ IP_util_E2pl_m02_flg + IP_util_E2_m02_flg +
AE_NumVisit1_flg + OP_NumVisit1_m01_flg + IP_TotLoS_m02 +
Ft1_45 + IP_util_E1_m05_flg + IP_TotPrNonElecLoS_m02 +
IP_util_E2pl_m03_flg + LTC_coding + OP_NumVisit0105_m03_flg +
OP_NumVisit11pl_m03_flg + AE_ArrAmb_m02_flg)
Quindi ho previsto i risultati per un diverso set di dati utilizzando la funzione di previsione:
log.pred.f.v <- predict(final.model.f, newdata=LOG_V)
Sono stato in grado di stabilire una curva ROC piacevole e ho creato una tabella per stabilire la sensibilità e la specificità che mi danno le risposte che mi sarei aspettato.
Tuttavia, ciò che sto cercando di fare è stabilire per ogni riga di dati quale sia la probabilità che Ft_45 sia 1. Se guardo l'output di log.pred.fv, ad esempio, ottengo:
1 -0.171739593
2 -0.049905948
3 0.141146419
4 0.11615669
5 0.07342591
6 0.093054334
7 0.957164383
8 0.098415639
.
.
.
104 0.196368229
105 1.045208447
106 1.05499112
Dato che ho solo una comprensione provvisoria di ciò che sto facendo, faccio fatica a capire come interpretare i valori negativi e più alti di 1 come mi aspetterei che una probabilità sia compresa tra 0 e 1.
Quindi la mia domanda è: mi manca solo un passaggio in cui ho bisogno di trasformare l'output o ho sbagliato completamente. Grazie in anticipo per qualsiasi aiuto tu possa offrire.