http://www.chioka.in/differences-between-l1-and-l2-as-loss-function-and-regularization/
Se guardi all'inizio di questo post, lo scrittore menziona che la norma L2 ha una soluzione unica e che la norma L1 ha probabilmente molte soluzioni. Lo capisco in termini di regolarizzazione, ma non in termini di utilizzo della norma L1 o L2 nella funzione di perdita.
Se guardi i grafici delle funzioni di x scalare (x ^ 2 e | x |), puoi facilmente vedere che entrambi hanno una soluzione unica.