Ho ripensato una risposta che ho dato a una domanda un paio di settimane fa
La convalida incrociata hold-out produce un singolo set di test che può essere utilizzato ripetutamente per la dimostrazione. Sembriamo tutti d'accordo sul fatto che questo è in molti modi una caratteristica negativa, dal momento che il set tenuto fuori potrebbe rivelarsi non rappresentativo attraverso la casualità. Inoltre, potresti finire con il sovradimensionamento dei dati di test nello stesso modo in cui puoi sovralimentare con i dati di allenamento.
Tuttavia, mi sembra che la natura statica di un campione tenuto in mano sia una migliore approssimazione di "ottenere più dati" rispetto al CV di k-fold ed evita il problema della media tra le pieghe. Tuttavia, non posso trovare alcuna base statistica per questa sensazione che ho. C'è qualche logica nella mia intuizione?
Ad esempio, ciò che ho in mente per un progetto imminente è innanzitutto utilizzare la convalida di controllo per creare e testare un modello, quindi come fase di convalida ridisegnare il set di controllo più volte per mostrare che le mie stime di errore di previsione ( sul set di test) sono robusti per l'errore di campionamento nel set di test. È una cattiva idea per qualche motivo? Questa domanda è stata posta prima ma non ha mai ricevuto risposta.