Non tutte le procedure statistiche si dividono in dati di addestramento / test, chiamati anche "convalida incrociata" (sebbene l'intera procedura implichi un po 'di più).
Piuttosto, questa è una tecnica che viene utilizzata specificamente per stimare l'errore fuori campione ; cioè quanto bene il tuo modello prevede nuovi risultati usando un nuovo set di dati? Questo diventa un problema molto importante quando si dispone, ad esempio, di un numero molto elevato di predittori rispetto al numero di campioni nel set di dati. In questi casi, è davvero facile costruire un modello con un errore nel campione grande ma un errore terribile fuori dal campione (chiamato "over fitting"). Nei casi in cui si hanno sia un gran numero di predittori che un gran numero di campioni, la convalida incrociata è uno strumento necessario per aiutare a valutare il comportamento del modello quando si prevede su nuovi dati. È anche uno strumento importante nella scelta tra modelli predittivi concorrenti.
In un'altra nota, la validazione incrociata viene quasi sempre utilizzata solo quando si cerca di costruire un modello predittivo . In generale, non è molto utile per i modelli quando si cerca di stimare l'effetto di un trattamento. Ad esempio, se si sta confrontando la distribuzione della resistenza alla trazione tra i materiali A e B (il "trattamento" è di tipo materiale), la convalida incrociata non sarà necessaria; mentre speriamo che la nostra stima dell'effetto del trattamento si generalizzi fuori campione, per la maggior parte dei problemi la teoria statistica classica può rispondere a questa (cioè "errori standard" delle stime) più precisamente della validazione incrociata. Sfortunatamente, metodologia statistica classica 1per errori standard non regge in caso di overfitting. La convalida incrociata spesso fa molto meglio in quel caso.
D'altra parte, se stai provando a prevedere quando un materiale si romperà sulla base di 10.000 variabili misurate che lancerai in un modello di apprendimento automatico basato su 100.000 osservazioni, avrai molti problemi a costruire un modello eccezionale senza convalida incrociata!
Sto indovinando molti degli esperimenti di fisica fatti, sei generalmente interessato alla stima degli effetti. In questi casi, c'è pochissima necessità di validazione incrociata.
1 Si potrebbe sostenere che i metodi bayesiani con priori informativi sono una metodologia statistica classica che affronta il overfitting. Ma questa è un'altra discussione.
Nota a margine: mentre la convalida incrociata è apparsa per la prima volta nella letteratura statistica, ed è sicuramente utilizzata da persone che si definiscono statistici, è diventata uno strumento fondamentale richiesto nella comunità dell'apprendimento automatico. Molti modelli statistici funzioneranno bene senza l'uso della convalida incrociata, ma quasi tutti i modelli considerati "modelli predittivi di apprendimento automatico" necessitano di convalida incrociata, poiché spesso richiedono la selezione di parametri di ottimizzazione, che è quasi impossibile fare a meno della croce -Validazione.