Questa è una domanda in generale, non specifica di alcun metodo o set di dati. Come affrontare un problema di squilibrio di classe nell'apprendimento automatico supervisionato in cui il numero di 0 è circa il 90% e il numero di 1 è circa il 10% nel set di dati. Come possiamo addestrare in modo ottimale il classificatore.
Uno dei modi che seguo è il campionamento per bilanciare il set di dati e quindi addestrare il classificatore e ripeterlo per più campioni.
Sento che questo è casuale, c'è qualche struttura per affrontare questo tipo di problemi.