TLDR:
Il mio set di dati è piuttosto piccolo (120) campioni. Durante la convalida incrociata di 10 volte, dovrei:
Raccogliere gli output da ciascuna piega di prova, concatenarli in un vettore e quindi calcolare l'errore su questo vettore completo di previsioni (120 campioni)?
O dovrei invece calcolare l'errore sugli output che ottengo su ogni piega (con 12 campioni per piega) e quindi ottenere la mia stima dell'errore finale come media delle stime dell'errore di 10 volte?
Ci sono articoli scientifici che sostengono le differenze tra queste tecniche?
Contesto: potenziale relazione con i punteggi Macro / Micro nella classificazione multietichetta:
Penso che questa domanda possa essere correlata alla differenza tra medie micro e macro che sono spesso utilizzate in un compito di classificazione multi-etichetta (ad esempio diciamo 5 etichette).
Nell'impostazione multi-etichetta, i punteggi della micro media vengono calcolati creando una tabella di contingenza aggregata di veri positivi, falsi positivi, veri negativi, falsi negativi per tutte e 5 le previsioni del classificatore su 120 campioni. Questa tabella di contingenza viene quindi utilizzata per calcolare la micro precisione, il micro richiamo e la micro misura f. Quindi quando abbiamo 120 campioni e cinque classificatori, le micro misure vengono calcolate su 600 previsioni (120 campioni * 5 etichette).
Quando si utilizza la variante Macro , si calcolano le misure (precisione, richiamo, ecc.) In modo indipendente su ciascuna etichetta e, infine, tali misure vengono calcolate in media.
L'idea alla base della differenza tra le stime micro vs Macro può essere estesa a ciò che può essere fatto in un'impostazione K-fold in un problema di classificazione binaria. Per 10 volte possiamo o mediare oltre 10 valori ( misura macro ) o concatenare i 10 esperimenti e calcolare le micro misure.
Sfondo - Esempio espanso:
L'esempio seguente illustra la domanda. Diciamo che abbiamo 12 campioni di test e abbiamo 10 pieghe:
- Piega 1 : TP = 4, FP = 0, TN = 8 Precisione = 1.0
- Piega 2 : TP = 4, FP = 0, TN = 8 Precisione = 1.0
- Piega 3 : TP = 4, FP = 0, TN = 8 Precisione = 1.0
- Piega 4 : TP = 0, FP = 12, Precisione = 0
- Piega 5 .. Piega 10 : tutti hanno lo stesso TP = 0, FP = 12 e Precisione = 0
dove ho usato la seguente notazione:
TP = # di veri positivi, FP = # falso positivo, TN = # di veri negativi
I risultati sono:
- Precisione media su 10 pieghe = 3/10 = 0,3
- Precisione sulla concatenazione delle previsioni delle 10 pieghe = TP / TP + FP = 12/12 + 84 = 0,125
Si noti che i valori 0,3 e 0,125 sono molto diversi !