Questo post segue questo: perché la stima della cresta diventa migliore di OLS aggiungendo una costante alla diagonale?
Ecco la mia domanda:
Per quanto ne so, la regolarizzazione della cresta usa un -norm (distanza euclidea). Ma perché usiamo il quadrato di questa norma? (un'applicazione diretta di risulterebbe con la radice quadrata della somma del beta quadrato).ℓ 2
Per fare un confronto, non lo facciamo per LASSO, che usa un -norm per regolarizzare. Ma qui è la norma "reale" (solo la somma del quadrato dei valori assoluti beta e non il quadrato di questa somma).ℓ 1
Qualcuno può aiutarmi a chiarire?