La regressione con la regolarizzazione L1 è la stessa di Lazo e con la regolarizzazione L2 è uguale alla regressione della cresta? E come scrivere "Lasso"?


33

Sono un ingegnere informatico che impara l'apprendimento automatico, in particolare attraverso i corsi di apprendimento automatico di Andrew Ng . Mentre studiavo la regressione lineare con la regolarizzazione , ho trovato termini che confondono:

  • Regressione con regolarizzazione L1 o regolarizzazione L2
  • LASSO
  • Regressione della cresta

Quindi le mie domande:

  1. La regressione con la regolarizzazione L1 è esattamente la stessa di LASSO?

  2. La regressione con la regolarizzazione L2 è esattamente la stessa della regressione di Ridge?

  3. Come si usa "LASSO" per iscritto? Dovrebbe essere "regressione LASSO"? Ho visto un uso come " il lazo è più appropriato ".

Se la risposta è "sì" per 1 e 2 sopra, allora perché ci sono nomi diversi per questi due termini? "L1" e "L2" provengono dall'informatica / matematica e "LASSO" e "Ridge" dalle statistiche?

L'uso di questi termini è confuso quando vedo post come:

" Qual è la differenza tra la regolarizzazione L1 e L2? " (Quora.com)

" Quando dovrei usare lasso vs ridge? " (Stats.stackexchange.com)


Anche se rispondo in ritardo. Questa guida completa per principianti per la regressione lineare, cresta e lasso aiuterà i principianti a comprendere chiaramente questi termini. Vedi qui
Learner,

Risposte:


34
  1. Sì.

  2. Sì.

  3. LASSO è in realtà un acronimo (operatore di restringimento e selezione meno assoluto), quindi dovrebbe essere in maiuscolo, ma la scrittura moderna è l'equivalente lessicale di Mad Max . D'altra parte, Amoeba scrive che anche gli statistici che hanno coniato il termine LASSO ora usano il rendering in minuscolo (Hastie, Tibshirani e Wainwright, Statistical Learning with Sparsity ). Si può solo speculare sulla motivazione del passaggio. Se stai scrivendo per una stampa accademica, in genere hanno una guida di stile per questo genere di cose. Se stai scrivendo su questo forum, va bene lo stesso, e dubito che a qualcuno importi davvero.

LLpp>0

xp=(|x1|p+|x2|p+...+|xn|p)1p
p10<p<1

Non sono sicuro quando è stata realizzata la connessione tra la cresta e LASSO.

Per quanto riguarda il motivo per cui ci sono più nomi, è solo una questione che questi metodi si siano sviluppati in luoghi diversi in momenti diversi. Un tema comune nelle statistiche è che i concetti spesso hanno più nomi, uno per ogni sottocampo in cui è stato scoperto in modo indipendente (funzioni del kernel vs funzioni di covarianza, regressione del processo gaussiana vs Kriging, AUC vs -statistic). La regressione della cresta dovrebbe probabilmente essere chiamata regolarizzazione di Tikhonov, poiché credo che abbia la prima pretesa sul metodo. Nel frattempo, LASSO fu introdotto solo nel 1996, molto più tardi del metodo "cresta" di Tikhonov!c


6
+1. Nel recente libro di Statistical Learning with Sparsity , Hastie, Tibshirani e Wainwright usano "lazo" tutto in minuscolo ovunque e scrivono anche quanto segue (nota in calce a pagina 8): "Un lazo è una lunga corda con un cappio a uno fine, usato per catturare cavalli e bovini. In senso figurato, il metodo "lassos" i coefficienti del modello. Nel documento originale del lazo (Tibshirani 1996), il nome "lasso" è stato anche introdotto come acronimo di "Least Absolute" Operatore di selezione e restringimento. "" (Da CC a @ Stackoverflowuser2010.)
Ameba dice Ripristina Monica

3
E continuano: "Pronuncia: negli Stati Uniti" lasso "tende ad essere pronunciato" lass-oh "(oh come nella capra), mentre nel Regno Unito" lass-oo ". Nell'OED (2a edizione, 1965):" il lazo è pronunciato lasoo da coloro che lo usano e anche dalla maggior parte degli inglesi. "" :-)
amoeba dice Reinstate Monica

4
(+1) Dato che gli acronimi propri (quelle abbreviazioni pronunciate come parole) guadagnano valuta, la loro capitalizzazione tende ad andare dal consiglio. È da un po 'che non vedo "RADAR" o "LASER".
Scortchi - Ripristina Monica

2
@Scortchi SCUBA. Nel frattempo abbiamo persone che scrivono STATA e MATLAB come se fossero acronimi.
Shadowtalker

2
@ssdecontrol: "ANOVA" dovrebbe essere "AnOVa" allora?
Scortchi - Ripristina Monica
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.