Di recente mi sono imbattuto in un documento che propone di utilizzare un classificatore k-NN su un set di dati specifico. Gli autori hanno utilizzato tutti i campioni di dati disponibili per eseguire la convalida incrociata k-fold per diversi valori k e riportare i risultati della convalida incrociata della migliore configurazione dell'iperparametro.
Per quanto ne so, questo risultato è distorto e avrebbero dovuto conservare un set di test separato per ottenere una stima dell'accuratezza su campioni non utilizzati per eseguire l'ottimizzazione dell'iperparametro.
Ho ragione? Potete fornire alcuni riferimenti (preferibilmente documenti di ricerca) che descrivono questo uso improprio della convalida incrociata?