Risposte:
In primo luogo, dovremmo concentrarci sul lato destro della trama, dove ci sono dati sufficienti per la valutazione.
Se due curve sono "vicine tra loro" ed entrambe ma hanno un punteggio basso. Il modello soffre di un problema insufficiente (High Bias)
Se la curva di allenamento ha un punteggio molto migliore ma la curva di test ha un punteggio più basso, cioè ci sono ampi spazi tra due curve. Quindi il modello soffre di un problema di adattamento eccessivo (alta varianza)
Dalla trama è difficile dire se il modello è buono o no. È possibile che tu abbia davvero un "problema facile", un buon modello può raggiungere il 90%. D'altra parte, è possibile che tu abbia davvero un "problema difficile" che la cosa migliore che possiamo fare è raggiungere il 70%. (Tieni presente che potresti non aspettarti di avere un modello perfetto, ad esempio il punteggio è 1. Quanto puoi ottenere dipende dalla quantità di rumore nei tuoi dati. Supponi che i tuoi dati abbiano molti punti di dati con funzionalità ESATTA ma etichette diverse, non importa quello che fai, non puoi ottenere 1 in punteggio.)
Un altro problema nel tuo esempio è che 350 esempi sembrano essere troppo piccoli in un'applicazione del mondo reale.
Per capire meglio, puoi fare i seguenti esperimenti per sperimentare un adattamento eccessivo e osservare cosa accadrà nella curva di apprendimento.
Selezionare un dato molto complicato, ad esempio i dati MNIST, e adattarsi a un modello semplice, ad esempio un modello lineare con una funzione.
Selezionare un dato semplice, ad esempio i dati dell'iride, adattarsi a un modello di complessità, ad esempio SVM.
Inoltre, fornirò due esempi relativi a under fitting e over fitting. Nota che questa non è una curva di apprendimento, ma le prestazioni rispetto al numero di iterazioni nel modello di incremento gradiente , dove più iterazioni avranno maggiori possibilità di adattamento eccessivo. L'asse x mostra il numero di iterazioni e l'asse y mostra le prestazioni, che è Area negativa sotto ROC (più bassa è, meglio è).
La sottotrama sinistra non soffre di eccesso di adattamento (anche se non è insufficiente poiché le prestazioni sono ragionevolmente buone), ma quella destra soffre di eccesso di adattamento quando il numero di iterazioni è elevato.