Ho appena finito di leggere questa discussione. Sostengono che PR AUC è migliore di ROC AUC su set di dati non bilanciati.
Ad esempio, abbiamo 10 campioni nel set di dati di prova. 9 campioni sono positivi e 1 è negativo. Abbiamo un modello terribile che prevede tutto positivo. Pertanto, avremo una metrica che TP = 9, FP = 1, TN = 0, FN = 0.
Quindi, Precisione = 0.9, Richiamo = 1.0. La precisione e il richiamo sono entrambi molto elevati, ma abbiamo un classificatore scarso.
D'altra parte, TPR = TP / (TP + FN) = 1.0, FPR = FP / (FP + TN) = 1.0. Poiché l'FPR è molto elevato, possiamo identificare che questo non è un buon classificatore.
Chiaramente, ROC è meglio di PR su set di dati non bilanciati. Qualcuno può spiegare perché PR è meglio?