Ho alcuni dati e voglio costruire un modello (per esempio un modello di regressione lineare) da questi dati. Nel prossimo passaggio, voglio applicare il modello di convalida incrociata (LOOCV) Leave-One-Out sul modello, quindi guarda quanto funziona bene.
Se ho capito bene LOOCV, ho creato un nuovo modello per ciascuno dei miei campioni (il set di test) usando ogni campione tranne questo campione (il set di addestramento). Quindi utilizzo il modello per prevedere il set di test e calcolare gli errori .
Nel passaggio successivo aggregherò tutti gli errori generati utilizzando una funzione scelta, ad esempio errore quadratico medio. Posso usare questi valori per giudicare la qualità (o la bontà di adattamento) del modello.
Domanda: a quale modello si applicano i valori di qualità, quindi quale modello devo scegliere se trovo le metriche generate da LOOCV appropriate per il mio caso? LOOCV ha esaminato diversi modelli (dove è la dimensione del campione); quale è il modello che dovrei scegliere?
- È il modello che utilizza tutti i campioni? Questo modello non è mai stato calcolato durante il processo LOOCV!
- È il modello che presenta il minor errore?