Ho letto della convalida di k-fold e voglio essere sicuro di capire come funziona.
So che per il metodo di controllo, i dati vengono suddivisi in tre set e il set di test viene utilizzato solo alla fine per valutare le prestazioni del modello, mentre il set di convalida viene utilizzato per ottimizzare gli iperparametri, ecc.
Nel metodo k-fold, teniamo ancora un set di test fino alla fine e utilizziamo solo i dati rimanenti per l'allenamento e la messa a punto dell'iperparametro, cioè dividiamo i dati rimanenti in k fold e quindi usiamo l'accuratezza media dopo l'allenamento con ogni piega (o qualunque metrica di prestazione scegliamo di ottimizzare i nostri iperparametri)? Oppure non utilizziamo affatto un set di test separato e suddividiamo semplicemente l'intero set di dati in k fold (in questo caso, suppongo che consideriamo l'accuratezza media su k fold come la nostra accuratezza finale)?