C'è davvero qualche differenza tra il coltellino e lasciare fuori una validazione incrociata? La procedura sembra identica, mi sto perdendo qualcosa?
C'è davvero qualche differenza tra il coltellino e lasciare fuori una validazione incrociata? La procedura sembra identica, mi sto perdendo qualcosa?
Risposte:
Nella convalida incrociata si calcola una statistica sui campioni di sinistra. Molto spesso, si prevedono i campioni esclusi da un modello basato sui campioni conservati. Nel jackknifing, si calcola una statistica solo dai campioni conservati.
Jackknife si riferisce spesso a 2 processi correlati ma diversi, entrambi basati su un approccio univoco - che porta a questa confusione.
In un contesto, jackknife può essere utilizzato per stimare i parametri della popolazione e i loro errori standard. Ad esempio, per utilizzare un approccio a coltello per stimare la pendenza e l'intercettazione di un modello di regressione semplice, si dovrebbe:
Gli pseudo valori e le stime del coefficiente di presa dei coefficienti possono anche essere usati per determinare gli errori standard e quindi gli intervalli di confidenza. Tipicamente questo approccio offre intervalli di confidenza più ampi per i coefficienti perché è una misura migliore, più conservativa, dell'incertezza. Inoltre, questo approccio può essere utilizzato per ottenere una stima del coltello a serramanico anche per i coefficienti.
Nell'altro contesto, jackknife viene utilizzato per valutare le prestazioni del modello. In questo caso jackknife = validazione incrociata "lascia una sola". Entrambi si riferiscono a lasciare un'osservazione fuori dal set di dati di calibrazione, ricalibrare il modello e prevedere l'osservazione che è stata lasciata fuori. In sostanza, ogni osservazione viene prevista usando le sue "stime parziali" dei predittori.
Ecco un bel piccolo articolo su jackknife che ho trovato online: https://www.utdallas.edu/~herve/abdi-Jackknife2010-pretty.pdf