Ho un problema di classificazione ( classe ), con l'ordine di 100 predittori a valore reale, uno dei quali sembra avere un potere esplicativo molto più di qualsiasi altro. Mi piacerebbe approfondire gli effetti delle altre variabili. Tuttavia, le tecniche di apprendimento automatico standard (foreste casuali, SVM, ecc.) Sembrano essere sommerse da un forte predittore e non mi danno molte informazioni interessanti sugli altri.
Se questo fosse un problema di regressione, regredirei semplicemente contro il predittore forte e quindi utilizzerei i residui come input per altri algoritmi. Non vedo davvero come questo approccio possa essere tradotto in un contesto di classificazione.
Il mio istinto è che questo problema deve essere ragionevolmente comune: esiste una tecnica standard per affrontarlo?