Ho caratteristiche sparse che sono predittive, inoltre ho alcune caratteristiche dense che sono anche predittive. Devo combinare queste funzionalità insieme per migliorare le prestazioni complessive del classificatore.
Ora, il problema è che quando provo a combinarli insieme, le funzioni dense tendono a dominare di più rispetto alle funzioni sparse, offrendo quindi un miglioramento dell'1% dell'AUC rispetto al modello con solo funzioni dense.
Qualcuno ha riscontrato problemi simili? Apprezzo molto gli input, un po 'bloccati. Ho già provato molti classificatori diversi, combinazione di classificatori, trasformazioni di funzionalità ed elaborazione con algoritmi diversi.
Grazie in anticipo per l'aiuto.
Modifica :
Ho già provato i suggerimenti forniti nei commenti. Quello che ho osservato è che, per quasi il 45% dei dati, le funzionalità sparse funzionano davvero bene, ottengo un AUC di circa 0,9 con solo funzionalità sparse, ma per le restanti funzioni dense funzionano bene con un AUC di circa 0,75. In un certo senso ho provato a separare questi set di dati, ma ottengo l'AUC di 0,6, quindi non posso semplicemente addestrare un modello e decidere quali funzionalità utilizzare.
Per quanto riguarda lo snippet di codice, ho provato così tante cose, che non sono sicuro di cosa esattamente condividere :(