Ho trovato questo confuso quando uso la cassetta degli attrezzi della rete neurale in Matlab.
Ha diviso il set di dati non elaborati in tre parti:
- set di allenamento
- set di validazione
- set di test
Noto in molti algoritmi di allenamento o di apprendimento, i dati sono spesso divisi in 2 parti, il set di allenamento e il set di test.
Le mie domande sono:
- qual è la differenza tra set di validazione e set di test?
- Il set di validazione è davvero specifico per la rete neurale? O è facoltativo.
- Per andare oltre, c'è una differenza tra validazione e test nel contesto dell'apprendimento automatico?
The training set is used to fit the models; the validation set is used to estimate prediction error for model selection; the test set is used for assessment of the generalization error of the final chosen model. Ideally, the test set should be kept in a “vault,” and be brought out only at the end of the data analysis.