Norms - Cosa c'è di speciale in?


13

Una norma L1 è unica (almeno in parte) perché p=1 è al confine tra non convesso e convesso. Una norma L1 è la norma convessa "più scarsa" (giusto?).

Capisco che la norma euclidea ha radici nella geometria e ha una chiara interpretazione quando le dimensioni hanno le stesse unità. Ma non capisco perché sia ​​usato preferenzialmente su altri numeri reali : ? ? Perché non utilizzare l'intero intervallo continuo come iperparametro?p > 1 p = 1,5 p = πp=2p>1p=1.5p=π

Cosa mi sto perdendo?


1
"Usato preferenzialmente" in quali applicazioni, in particolare? Le norme sono onnipresenti in matematica, statistica e fisica; in alcuni sottocampi alcune norme sono più diffuse di altre perché sono più significative o più semplici con cui lavorare. Per questo motivo, le risposte a questa domanda saranno probabilmente numerose e varie (così varie, anzi, che personalmente la trovo senza risposta). Ho quindi reso questo un post "Community Wiki" (CW); ma se hai in mente un'applicazione specifica o un campo ristretto, rendendo più precisa la tua domanda dovrebbe essere possibile rimuovere lo stato CW.
whuber

Risposte:


12

Una spiegazione più matematica è che lo spazio , costituito da tutte le serie che convergono in p-norm, è solo Hilbert con p = 2 e nessun altro valore. Ciò significa che questo spazio è completo e la norma su quello spazio può essere indotta da un prodotto interno (pensate al familiare punto-prodotto in R n ), quindi è un po 'più bello lavorare con.lpp=2Rn


4

Ecco un paio di motivi:

  1. È collegato in modo molto speciale al prodotto interno: è la sua doppia norma (cioè è "auto-duplice").
    Ciò significa che, se si considerano tutti i vettori all'interno della sfera unità, il loro prodotto interno massimo con qualsiasi vettore z è la norma 2 di z stessa. Meno fantasiosamente, soddisfa la proprietà che x 2 2 = x x . Nessun altro p norma si comporta in questo modo.2z2zx22=xxp

  2. Ha una sfumatura molto comoda: Non puoi davvero batterlo!

    x f(x)22=2 f(x)f(x)

2

Sebbene ci possano essere molti altri motivi, ma AFAIK p = 2 è preferito per i seguenti motivi:

  • Misura di somiglianza / dissomiglianza: per p = 2, la norma euclidea fornisce una misura di somiglianza o dissomiglianza tra due vettori che può quindi essere ulteriormente utilizzata per ottenere una migliore comprensione dei dati. Le risposte più dettagliate su questo possono essere trovate qui .
  • Regolarizzazione: la norma L2 viene utilizzata per la regolarizzazione nell'apprendimento automatico ed è preferita per due motivi: 1) È facilmente differenziabile 2) Con la regolarizzazione L2, i pesi tendono a ridursi in proporzione ai pesi. Quindi la regolarizzazione L2 penalizza maggiormente i pesi maggiori rispetto ai pesi più piccoli.

1

Gli errori quadrati nei modelli lineari sono spesso preferiti a causa di:

  • la relazione con l'ortogonalità, che si comporta bene rispetto ad alcuni fenomeni casuali considerati rumore (non correlazione)
  • L1
  • produce algoritmi di ottimizzazione trattabili quando la derivata si trasforma in sistemi lineari

L11p0<p<1

000p1p0p0

1/21/2

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.