La domanda è piuttosto vaga, quindi suppongo che tu voglia scegliere una misura di prestazione appropriata per confrontare diversi modelli. Per una buona panoramica delle principali differenze tra le curve ROC e PR, è possibile fare riferimento al seguente documento: La relazione tra precisione-richiamo e curve ROC di Davis e Goadrich .
Per citare Davis e Goadrich:
Tuttavia, quando si ha a che fare con set di dati altamente distorti, le curve di precisione (PR) forniscono un quadro più informativo delle prestazioni di un algoritmo.
FPR = FPFP+ TN,TPR = TPTP+ FN.
r e c a l l = TPTP+ FN= TPR ,p r e c i s i o n = TPTP+ FP
FP
Le curve di richiamo di precisione sono meglio evidenziare le differenze tra i modelli per set di dati altamente squilibrati. Se si desidera confrontare diversi modelli in impostazioni sbilanciate, l'area sotto la curva PR mostrerà probabilmente differenze maggiori rispetto all'area sotto la curva ROC.
Detto questo, le curve ROC sono molto più comuni (anche se sono meno adatte). A seconda del pubblico, le curve ROC possono essere la lingua franca, quindi l'utilizzo di queste è probabilmente la scelta più sicura. Se un modello domina completamente un altro nello spazio PR (ad esempio, ha sempre una maggiore precisione sull'intero intervallo di richiamo), dominerà anche nello spazio ROC. Se le curve si incrociano in uno spazio, si incrociano anche nell'altro. In altre parole, le conclusioni principali saranno simili, indipendentemente dalla curva utilizzata.
Pubblicità senza vergogna . Come ulteriore esempio, potresti dare un'occhiata a uno dei miei articoli in cui riporto sia le curve ROC che le PR in un ambiente sbilanciato. La Figura 3 contiene curve ROC e PR per modelli identici, mostrando chiaramente la differenza tra i due. Per confrontare l'area sotto l'area PR rispetto all'area sotto ROC è possibile confrontare le tabelle 1-2 (AUPR) e le tabelle 3-4 (AUROC) in cui è possibile vedere che AUPR mostra differenze molto maggiori tra i singoli modelli rispetto ad AUROC. Ciò sottolinea ancora una volta l'idoneità delle curve PR.