Qual è il modo migliore per classificare gli approcci che sono stati sviluppati per affrontare il problema della classe di squilibrio?
Questo articolo li classifica in:
- Preelaborazione: include il sovracampionamento, il sottocampionamento e metodi ibridi,
- Apprendimento sensibile ai costi: comprende metodi diretti e meta-apprendimento che questi ultimi ulteriormente dividono in soglia e campionamento,
- Tecniche di ensemble: comprende ensemble sensibili ai costi e preelaborazione dei dati in combinazione con l'apprendimento degli ensemble.
La seconda classificazione:
- Pre-elaborazione dei dati: include la modifica della distribuzione e la ponderazione dello spazio dati. L'apprendimento di una classe è considerato come un cambiamento di distribuzione.
- Metodi di apprendimento specifici
- Post-elaborazione di previsione: include il metodo di soglia e la post-elaborazione sensibile ai costi
- Metodi ibridi:
Il terzo articolo :
- Metodi a livello di dati
- Metodi a livello di algoritmo
- Metodi ibridi
L'ultima classificazione considera anche la regolazione dell'output come un approccio indipendente.
Grazie in anticipo.