Buona precisione nonostante l'alto valore di perdita


15

Durante l'addestramento di un semplice classificatore binario di una rete neurale ottengo un alto valore di perdita, usando l'entropia incrociata. Nonostante ciò, il valore dell'accuratezza sul set di validazione è abbastanza buono. Ha qualche significato? Non esiste una stretta correlazione tra perdita e precisione?

Ho sulla formazione e la convalida di questi valori: 0.4011 - acc: 0.8224 - val_loss: 0.4577 - val_acc: 0.7826 . Questo è il mio primo tentativo di implementare un NN e mi sono appena avvicinato all'apprendimento automatico, quindi non sono in grado di valutare correttamente questi risultati.


3
Noti un alto valore di perdita solo sul set di addestramento o anche sulla validazione? C'è un forte calo di precisione o perdita quando si confrontano il set di addestramento e il set di validazione? Alcune cifre sarebbero utili
Hugh,

Risposte:


20

Ho riscontrato un problema simile.

Ho addestrato il mio classificatore binario della rete neurale con una perdita di entropia incrociata. Qui il risultato dell'entropia crociata in funzione dell'epoca. Il rosso è per il set di allenamento e il blu per il set di test.

Entropia incrociata in funzione dell'epoca.

Mostrando la precisione, ho avuto la sorpresa di ottenere una migliore precisione per l'epoca 1000 rispetto all'epoca 50, anche per il set di test!

Precisione in funzione dell'epoca

Per comprendere le relazioni tra entropia incrociata e accuratezza, ho scavato in un modello più semplice, la regressione logistica (con un input e un output). Di seguito, ho appena illustrato questa relazione in 3 casi speciali.

In generale, il parametro in cui l'entropia crociata è minima non è il parametro in cui la precisione è massima. Tuttavia, possiamo aspettarci una relazione tra entropia incrociata e accuratezza.

[Di seguito, suppongo che tu sappia cos'è l'entropia incrociata, perché la usiamo invece dell'accuratezza per addestrare il modello, ecc. In caso contrario, leggi prima: Come interpretare un punteggio dell'entropia incrociata? ]

Illustrazione 1 Questa è per mostrare che il parametro in cui l'entropia incrociata è minima non è il parametro in cui l'accuratezza è massima e per capire il perché.

Ecco i miei dati di esempio. Ho 5 punti e, ad esempio, l'ingresso -1 ha portato all'uscita 0. Campione di 5 punti

Entropia incrociata. Dopo aver minimizzato l'entropia crociata, ottengo una precisione di 0,6. Il taglio tra 0 e 1 viene eseguito su x = 0,52. Per i 5 valori, ottengo rispettivamente un'entropia incrociata di: 0,14, 0,30, 1,07, 0,97, 0,43.

Precisione. Dopo aver massimizzato la precisione su una griglia, ottengo molti parametri diversi che portano a 0,8. Questo può essere mostrato direttamente, selezionando il taglio x = -0.1. Bene, puoi anche selezionare x = 0,95 per tagliare i set.

Nel primo caso, l'entropia crociata è grande. In effetti, il quarto punto è lontano dal taglio, quindi ha una grande entropia crociata. Vale a dire, ottengo rispettivamente un'entropia crociata di: 0,01, 0,31, 0,47, 5,01, 0,004.

Nel secondo caso, anche l'entropia crociata è grande. In quel caso, il terzo punto è lontano dal taglio, quindi ha una grande entropia crociata. Ottengo rispettivamente un'entropia crociata di: 5e-5, 2e-3, 4.81, 0.6, 0.6.

un'un'BPiccolo esempio di dati

n=100un'=0.3B=0.5

BBun'Set medio

un'

un'=0.3

n=10000un'=1B=0

Dati abbastanza grandi

Penso che se il modello ha una capacità sufficiente (sufficiente per contenere il modello reale) e se i dati sono grandi (ovvero la dimensione del campione va all'infinito), l'entropia incrociata può essere minima quando la precisione è massima, almeno per il modello logistico . Non ne ho la prova, se qualcuno ha un riferimento, per favore condividi.

Bibliografia: L'argomento che collega l'entropia incrociata e l'accuratezza è interessante e complesso, ma non riesco a trovare articoli che trattano questo ... Studiare l'accuratezza è interessante perché, nonostante sia una regola di punteggio impropria, ognuno può comprenderne il significato.

Nota: in primo luogo, vorrei trovare una risposta su questo sito Web, i post relativi alla relazione tra accuratezza ed entropia incrociata sono numerosi ma con poche risposte, vedi: Traing comparabile e test di entropia incrociata producono accuratezze molto diverse ; Perdita di convalida in calo, ma peggioramento dell'accuratezza della convalida ; Dubbio sulla funzione categorica di perdita di entropia incrociata ; Interpretazione della perdita di log in percentuale ...


Illustrazioni molto buone. Ispirato da queste illustrazioni, concludo a 2 possibili motivi. 1. Il modello è troppo semplice per estrarre le funzionalità richieste per la previsione. Nella tua Illustrazione 1, è un problema molteplice e devi ottenere un altro livello per ottenere una precisione del 100%.
Diansheng,

-1

ahstat offre ottime illustrazioni.

Ispirato da queste illustrazioni, concludo a 2 possibili motivi. 1. Il modello è troppo semplice per estrarre le funzionalità richieste per la previsione. Nella tua Illustrazione 1, è un problema molteplice e devi ottenere un altro livello per ottenere una precisione del 100%. 2. I dati hanno troppe etichette rumorose (confronta le figure 1 e 3)

Per quanto riguarda l'illustrazione 2, spiega perché non possiamo aggiungere troppa regolarizzazione L1 / L2 al modello.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.