Fornito una dimensione del campione "N" che ho intenzione di utilizzare per prevedere i dati. Quali sono alcuni modi per suddividere i dati in modo che io ne usi alcuni per stabilire un modello e i dati rimanenti per convalidare il modello?
So che non esiste una risposta in bianco e nero a questo, ma sarebbe interessante conoscere alcune "regole empiriche" o rapporti generalmente usati. Conosco all'università, uno dei nostri professori era solito dire modello sul 60% e validare sul 40%.