Se ho già trovato la funzione di costo minimo sul sottoinsieme di convalida, perché dovrei testarla di nuovo sul sottoinsieme di test
A causa di un errore casuale: di solito hai solo un numero finito di casi.
L'ottimizzazione delle prestazioni di validazione (test interno) significa che potresti essere troppo adatto a quel set di test interno. Il set di test interno contribuisce alla stima del modello finale e non è quindi indipendente dal modello.
Ciò significa che è necessario disporre di un altro set di test (esterno) indipendente dall'intera procedura di modellazione (compresi tutti i processi di ottimizzazione e pre-elaborazione basata su dati o selezione del modello) se si desidera stimare le proprietà di generalizzazione.
Ti consiglio di fare una simulazione e confrontare le tre diverse stime di errore che puoi avere
- riattivazione: la previsione del set di treni
misura la bontà di adattamento
- set di test interni (nella tua nomenclatura: validazione): qualità raggiunta dall'ottimizzatore
- set di test esterno: errore di generalizzazione, indipendente dall'allenamento del modello.
In una simulazione è possibile confrontarli facilmente anche con un set di test adeguato, ampio e generato in modo indipendente. Se l'impostazione è corretta, il test esterno dovrebbe essere imparziale (scrivere il modello surrogato che valuta, non scrivere un modello "finale" basato sull'intero set di dati). Il test interno è di solito ottimisticamente distorto e la reintegrazione è ancora più ottimisticamente parziale.
Nel mio campo, il test interno avrebbe facilmente sottostimato l'errore di generalizzazione di un fattore 2 - 5 (molto di più per gli schemi di ottimizzazione aggressiva).
Nota: la nomenclatura degli insiemi non è universale. Nel mio campo (chimica analitica), la validazione significherebbe di solito la prova dell'esecuzione della procedura finale - quindi più ciò che fa il tuo set di "test" che quello che fa il tuo set di "validazione".
Preferisco quindi parlare del set di test interno ed esterno o del set di test di ottimizzazione (= set di test interno) e quindi un set di validazione significherebbe il set di test esterno.