Questa metodologia è descritta nel documento glmnet Percorsi di regolarizzazione per modelli lineari generalizzati tramite discesa delle coordinate . Sebbene la metodologia qui sia per il caso generale della regolarizzazione sia che , dovrebbe applicarsi anche a LASSO (solo ).L1L2L1
La soluzione per il massimo è data nella sezione 2.5. λ
Quando , vediamo da (5) che rimarrà zero se . Quindiβ~=0β~j1N|⟨xj,y⟩|<λαNαλmax=maxl|⟨xl,y⟩|
Ossia, osserviamo che la regola di aggiornamento per beta impone a zero tutte le stime dei parametri per come determinato sopra.λ>λmax
La determinazione di e il numero di punti della griglia sembrano meno di principio. In glmnet impostano , quindi scelgono una griglia di punti equidistanti sulla scala logaritmica.λminλmin=0.001∗λmax100
Funziona bene in pratica, nel mio ampio uso di glmnet non ho mai trovato questa griglia troppo grezza.
Nel LASSO ( ) solo le cose funzionano meglio, poiché il metodo LARS fornisce un calcolo preciso per quando i vari predittori entrano nel modello. Un vero LARS non esegue una ricerca della griglia su , producendo invece un'espressione esatta per i percorsi della soluzione per i coefficienti.
Ecco uno sguardo dettagliato al calcolo esatto dei percorsi dei coefficienti nel caso dei due predittori.L1λ
Il caso di modelli non lineari (ad es. Logistica, poisson) è più difficile. Ad un livello elevato, per prima cosa si ottiene un'approssimazione quadratica della funzione di perdita ai parametri iniziali , quindi il calcolo sopra è usato per determinare . In questi casi non è possibile un calcolo preciso dei percorsi dei parametri, anche quando viene fornita solo la regolarizzazione , quindi la ricerca della griglia è l'unica opzione.β=0λmaxL1
I pesi del campione complicano anche la situazione, i prodotti interni devono essere sostituiti in luoghi appropriati con prodotti interni ponderati.