L'AUC non confronta le classi reali con quelle previste tra loro. Non sta guardando la classe prevista, ma il punteggio di previsione o la probabilità. Puoi fare la previsione della classe applicando un limite a questo punteggio, diciamo, ogni campione che ha ottenuto un punteggio inferiore a 0,5 è classificato come negativo. Ma il ROC viene prima che ciò accada. Sta lavorando con i punteggi / le probabilità di classe.
Prende questi punteggi e ordina tutti i campioni in base a quel punteggio. Ora, ogni volta che trovi un campione positivo, la curva ROC fa un passo avanti (lungo l'asse y). Ogni volta che trovi un campione negativo ti sposti a destra (lungo l'asse x). Se quel punteggio è diverso per le due classi, i campioni positivi vengono prima (di solito). Ciò significa che fai più passi avanti che a destra. Più in basso nell'elenco verranno i campioni negativi, quindi ti sposterai a sinistra. Quando si passa attraverso l'intero elenco di campioni, si raggiunge la coordinata (1,1) che corrisponde al 100% dei campioni positivi e al 100% dei campioni negativi.
Se il punteggio separa perfettamente i positivi dai campioni negativi, ci si sposta completamente da (x = 0, y = 0) a (1,0) e quindi da lì a (1, 1). Quindi, l'area sotto la curva è 1.
Se il tuo punteggio ha la stessa distribuzione per campioni positivi e negativi, le probabilità di trovare un campione positivo o negativo nell'elenco ordinato sono uguali e quindi le probabilità di spostarsi verso l'alto o a sinistra nella curva ROC sono uguali. Questo è il motivo per cui ti muovi lungo la diagonale, perché essenzialmente ti muovi verso l'alto e a sinistra, e verso l'alto e a sinistra, e così via ... che dà un valore AROC di circa 0,5.
Nel caso di un set di dati non bilanciato, la dimensione del passaggio è diversa. Quindi, fai piccoli passi a sinistra (se hai più campioni negativi). Ecco perché il punteggio è più o meno indipendente dallo squilibrio.
Quindi, con la curva ROC, puoi visualizzare come i tuoi campioni sono separati e l'area sotto la curva può essere un'ottima metrica per misurare le prestazioni di un algoritmo di classificazione binaria o qualsiasi variabile che può essere utilizzata per separare le classi.

La figura mostra le stesse distribuzioni con diverse dimensioni del campione. L'area nera mostra dove ci si aspetterebbe curve ROC di miscele casuali di campioni positivi e negativi.