Come ogni metrica, una buona metrica è quella migliore di quella "stupida", per caso, se si dovesse indovinare senza informazioni sulle osservazioni. Questo è chiamato il modello di sola intercettazione nelle statistiche.
Questo indovino "stupido" dipende da 2 fattori:
- il numero di classi
- il bilancio delle classi: la loro prevalenza nel set di dati osservato
Nel caso della metrica LogLoss, una consueta metrica "ben nota" è quella di dire che 0,693 è il valore non informativo. Questa cifra si ottiene predicendo p = 0.5
per qualsiasi classe di un problema binario. Questo è valido solo per problemi binari bilanciati . Perché quando la prevalenza di una classe è del 10%, allora predirete p =0.1
sempre quella classe. Questa sarà la tua base di previsione stupida, per caso, perché la previsione 0.5
sarà più stupida .
I. Impatto del numero di classi N
sulla perdita del silenzio:
Nel caso bilanciato (ogni classe ha la stessa prevalenza), quando si prevede p = prevalence = 1 / N
per ogni osservazione, l'equazione diventa semplicemente:
Logloss = -log(1 / N)
log
essere Ln
, logaritmo nepalese per coloro che usano quella convenzione.
Nel caso binario, N = 2
:Logloss = - log(1/2) = 0.693
Quindi i dumb-logloss sono i seguenti:
II. Impatto della prevalenza delle classi sul Dumb-Logloss:
un. Caso di classificazione binaria
In questo caso, prevediamo sempre p(i) = prevalence(i)
e otteniamo la seguente tabella:
Quindi, quando le classi sono molto sbilanciate (prevalenza <2%), una perdita di log di 0,1 può effettivamente essere molto negativa! Una precisione del 98% sarebbe in tal caso negativa. Quindi forse Logloss non sarebbe la migliore metrica da utilizzare
b. Caso di tre classi
"Scemo", a seconda della prevalenza - caso di tre classi:
Possiamo vedere qui i valori dei casi binari bilanciati e di tre classi (0.69 e 1.1).
CONCLUSIONE
Una perdita di log di 0,69 può essere positiva in un problema multiclasse e pessima in un caso binario di parte.
A seconda del tuo caso, ti conviene calcolare te stesso la base del problema, per verificare il significato della tua previsione.
Nei casi distorti, capisco che logloss ha lo stesso problema dell'accuratezza e di altre funzioni di perdita: fornisce solo una misurazione globale delle prestazioni. Quindi completerai meglio la tua comprensione con metriche focalizzate sulle classi di minoranza (richiamo e precisione), o forse non usare affatto la perdita di log.