Supponiamo che io abbia una piccola dimensione del campione, ad esempio N = 100, e due classi. Come dovrei scegliere la formazione, la validazione incrociata e le dimensioni dei set di test per l'apprendimento automatico?
Vorrei scegliere intuitivamente
- La formazione imposta la dimensione come 50
- Convalida incrociata impostare la dimensione 25 e
- Dimensione del test come 25.
Ma probabilmente questo ha più o meno senso. Come dovrei davvero decidere questi valori? Posso provare diverse opzioni (anche se immagino che non sia così preferibile ... maggiore possibilità di apprendimento eccessivo)?
E se avessi più di due lezioni?