Per generare curve ROC (= curve caratteristiche operative del ricevitore):
Supponiamo di avere un classificatore binario probabilistico come la regressione logistica. Prima di presentare la curva ROC, è necessario comprendere il concetto di matrice di confusione . Quando facciamo una previsione binaria, possono esserci 4 tipi di errori:
- Prevediamo 0 mentre dovremmo avere la classe è effettivamente 0: questo è chiamato un vero negativo , cioè prevediamo correttamente che la classe è negativa (0). Ad esempio, un antivirus non ha rilevato un file innocuo come virus.
- Prevediamo 0 mentre dovremmo avere la classe è in realtà 1: questo si chiama Falso negativo , ovvero prevediamo erroneamente che la classe è negativa (0). Ad esempio, un antivirus non è riuscito a rilevare un virus.
- Prevediamo 1 mentre dovremmo avere la classe in realtà 0: questo si chiama Falso positivo , ovvero prevediamo erroneamente che la classe sia positiva (1). Ad esempio, un antivirus considerato un file innocuo come virus.
- Prevediamo 1 mentre dovremmo avere la classe è in realtà 1: questo è chiamato un vero positivo , cioè prevediamo correttamente che la classe è positiva (1). Ad esempio, un antivirus ha correttamente rilevato un virus.
Per ottenere la matrice di confusione, esaminiamo tutte le previsioni fatte dal modello e contiamo quante volte si verificano ciascuno di questi 4 tipi di errori:
In questo esempio di matrice di confusione, tra i 50 punti dati classificati, 45 sono correttamente classificati e 5 sono classificati erroneamente.
Dal momento che per confrontare due diversi modelli è spesso più conveniente avere un'unica metrica anziché più di una, calcoliamo due metriche dalla matrice di confusione, che in seguito combineremo in una sola:
- TPTP+ FN
- FPFP+ TN
0,00 ; 0,01 , 0,02 , … , 1,00
In questa figura, l'area blu corrisponde all'Area sotto la curva della caratteristica operativa del ricevitore (AUROC). La linea tratteggiata nella diagonale presentiamo la curva ROC di un predittore casuale: ha un AUROC di 0,5. Il predittore casuale è comunemente usato come base per vedere se il modello è utile.
Se vuoi fare un'esperienza di prima mano: