0-1 Spiegazione della funzione di perdita


19

Sto cercando di capire qual è lo scopo della funzione di perdita e non riesco proprio a capirlo.

Quindi, per quanto ho capito, la funzione di perdita è per introdurre un qualche tipo di metrica con cui possiamo misurare il "costo" di una decisione errata.

Quindi supponiamo di avere un set di dati di 30 oggetti, li ho divisi in set di allenamento / test come 20/10. Userò la funzione di perdita 0-1, quindi diciamo che il mio set di etichette di classe è M e la funzione è simile a questa :

L(i,j)={0i=j1iji,jM

Quindi ho creato un modello sui miei dati di allenamento, supponiamo che io stia usando il classificatore Naive Bayes e questo modello ha classificato correttamente 7 oggetti (assegnato loro le etichette di classe corrette) e 3 oggetti sono stati classificati in modo errato.

Quindi la mia funzione di perdita restituirebbe "0" 7 volte e "1" 3 volte - che tipo di informazioni posso ottenere da quello? Che il mio modello ha classificato il 30% degli oggetti in modo errato? O c'è di più?

Se ci sono errori nel mio modo di pensare, mi dispiace molto, sto solo cercando di imparare. Se l'esempio che ho fornito è "troppo astratto", fammi sapere, proverò ad essere più specifico. Se proverai a spiegare il concetto usando un esempio diverso, utilizza la funzione di perdita 0-1.

Risposte:


14

Hai riassunto correttamente la funzione di perdita 0-1 in modo efficace guardando l'accuratezza. I tuoi 1 diventano indicatori per oggetti classificati erroneamente, indipendentemente da come sono stati classificati erroneamente. Dato che hai tre 1 su 10 articoli, la precisione della tua classificazione è del 70%.

Se si modifica la ponderazione sulla funzione di perdita, questa interpretazione non si applica più. Ad esempio, nella classificazione della malattia, potrebbe essere più costoso perdere un caso positivo di malattia (falso negativo) che diagnosticare erroneamente la malattia (falso positivo). In questo caso, la tua funzione di perdita appesantirebbe più pesantemente la classificazione erroneamente falsa negativa. La somma delle perdite non rappresenterebbe più la precisione in questo caso, ma piuttosto il "costo" totale della classificazione errata. La funzione di perdita 0-1 è unica nella sua equivalenza alla precisione, poiché tutto ciò che ti interessa è se hai capito bene o no, e non come vengono fatti gli errori.


@JohnnyJohansson che è la definizione di accuratezza nelle statistiche, vedi en.wikipedia.org/wiki/Sensitivity_and_specificity
Tim

@Tim - Sono ancora confuso dalla funzione di perdita 0-1 - la matrice risultante potrebbe avere valori maggiori di 1, cioè se ci sono 3 classificazioni di errori vedremmo un valore di 3 nella voce corrispondente? vedi qui math.stackexchange.com/questions/2623072/…
Xavier Bourret Sicotte


0

Penso che la tua confusione non stia differenziando la perdita per un punto dati rispetto alla perdita per l'intero set di dati.

L(y,y^)

ΣioL(yio,y^io)

In realtà ottengo la differenza, ma è difficile per me capire cosa avrei bisogno di questa perdita per un punto dati diverso dal calcolo della perdita per l'intero set di dati? E cosa dovrei considerare quando scelgo la funzione di perdita adeguata per qualche problema particolare?
Johnny Johansson,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.