Perché la perdita di norma L2 ha una soluzione unica e la perdita di norma L1 ha possibilmente soluzioni multiple?


16

http://www.chioka.in/differences-between-l1-and-l2-as-loss-function-and-regularization/

Se guardi all'inizio di questo post, lo scrittore menziona che la norma L2 ha una soluzione unica e che la norma L1 ha probabilmente molte soluzioni. Lo capisco in termini di regolarizzazione, ma non in termini di utilizzo della norma L1 o L2 nella funzione di perdita.

Se guardi i grafici delle funzioni di x scalare (x ^ 2 e | x |), puoi facilmente vedere che entrambi hanno una soluzione unica.


2
"FNX"? ... Modifica per renderlo più chiaro. Intendi "funzioni"?
Glen_b

Risposte:


25

Consideriamo un problema unidimensionale per l'esposizione più semplice possibile. (I casi di dimensioni superiori hanno proprietà simili.)

|X-μ|(X-μ)2Σio|Xio-μ|X1=1X2=3

Trama di sum_i | x_i - mu |

μ

L1

Σio(Xio-μ)2=n(X¯-μ)2+K(X)


L1

Dal momento che (al di fuori di alcune circostanze specifiche) di solito non hai una tale garanzia di nessuna osservazione altamente influente, non definirei la regressione L1 robusta.


Codice R per trama:

 fi <- function(x,i=0) abs(x-i)
 f <- function(x) fi(x,1)+fi(x,3)
 plot(f,-1,5,ylim=c(0,6),col="blue",lwd=2)
 curve(fi(x,1),-1,5,lty=3,col="dimgrey",add=TRUE)
 curve(fi(x,3),-1,5,lty=3,col="dimgrey",add=TRUE)

Questo è fantastico Quale software hai usato per creare il grafico?
user3180,

2
R. Questo è appena fatto nella grafica di base. Ho aggiunto il codice alla fine della mia risposta.
Glen_b -Restate Monica

1
Woah, non ho mai capito che potresti fornire una funzione a plot. La mente è sconvolta.
JAD,

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.