Ho un set di 150 funzionalità e molte di esse sono altamente correlate tra loro. Il mio obiettivo è prevedere il valore di una variabile discreta, il cui intervallo è 1-8 . La mia dimensione del campione è 550 e sto usando una validazione incrociata di 10 volte .
AFAIK, tra i metodi di regolarizzazione (Lasso, ElasticNet e Ridge), Ridge è più rigoroso per la correlazione tra le caratteristiche. Ecco perché mi aspettavo che con Ridge avrei dovuto ottenere una previsione più accurata. Tuttavia, i miei risultati mostrano che l'errore assoluto medio di Lazo o Elastico è di circa 0,61 mentre questo punteggio è 0,97 per la regressione della cresta. Mi chiedo quale sarebbe una spiegazione per questo. È perché ho molte funzionalità e Lasso funziona meglio perché fa una sorta di selezione delle funzionalità, eliminando le funzionalità ridondanti?