Sto cercando di capire come calcolare il punto di taglio ottimale per una curva ROC (il valore al quale la sensibilità e la specificità sono massimizzate). Sto usando il set aSAH
di dati dal pacchetto pROC
.
La outcome
variabile potrebbe essere spiegata da due variabili indipendenti: s100b
e ndka
. Usando la sintassi del Epi
pacchetto, ho creato due modelli:
library(pROC)
library(Epi)
ROC(form=outcome~s100b, data=aSAH)
ROC(form=outcome~ndka, data=aSAH)
L'output è illustrato nei seguenti due grafici:
Nel primo grafico ( s100b
), la funzione afferma che il punto di taglio ottimale è localizzato al valore corrispondente a lr.eta=0.304
. Nel secondo grafico ( ndka
) il punto di taglio ottimale è localizzato al valore corrispondente a lr.eta=0.335
(qual è il significato di lr.eta
). La mia prima domanda è:
- qual è il corrispondente
s100b
e indka
valori per ilr.eta
valori indicati (qual è il punto di taglio ottimale in termini dis100b
endka
)?
SECONDA DOMANDA:
Supponiamo ora di creare un modello tenendo conto di entrambe le variabili:
ROC(form=outcome~ndka+s100b, data=aSAH)
Il grafico ottenuto è:
Voglio sapere quali sono i valori di ndka
AND s100b
a cui la sensibilità e la specificità sono massimizzate dalla funzione. In altri termini: quali sono i valori di ndka
e s100b
ai quali abbiamo Se = 68,3% e Sp = 76,4% (valori derivati dal grafico)?
Suppongo che questa seconda domanda sia correlata all'analisi multiROC, ma la documentazione del Epi
pacchetto non spiega come calcolare il punto di taglio ottimale per entrambe le variabili utilizzate nel modello.
La mia domanda sembra molto simile a quella di reasearchGate , che in breve dice:
La determinazione del punteggio limite che rappresenta un migliore compromesso tra sensibilità e specificità di una misura è semplice. Tuttavia, per l'analisi della curva ROC multivariata, ho notato che la maggior parte dei ricercatori si è concentrata su algoritmi per determinare l'accuratezza complessiva di una combinazione lineare di diversi indicatori (variabili) in termini di AUC. [...]
Tuttavia, questi metodi non menzionano come decidere una combinazione di punteggi di cut-off associati ai molteplici indicatori che forniscano la migliore precisione diagnostica.
Una possibile soluzione è quella proposta da Shultz nel suo articolo , ma da questo articolo non sono in grado di capire come calcolare il punto di taglio ottimale per una curva ROC multivariata.
Forse la soluzione dal Epi
pacchetto non è l'ideale, quindi qualsiasi altro link utile sarà apprezzato.