Cosa sono le norme e in che modo sono rilevanti per la regolarizzazione?


12

Ultimamente ho visto molti articoli su rappresentazioni sparse e la maggior parte di loro usa la norma e minimizza. La mia domanda è: qual è la norma e la norma mista ? E come sono rilevanti per la regolarizzazione?ppp,q

Grazie

Risposte:


13

p norme sono funzioni che accettano vettori e restituiscono numeri non negativi. Sono definiti come Nel caso in cui p = 2 , questo è chiamata la norma euclidea . È possibile definire la distanza euclidea come \ | \ vec x - \ vec y \ | _2 . Quando p = \ infty , ciò significa semplicemente \ | \ vec x \ | _ \ infty = \ sup_i x_i (o \ max_i x_i ). A rigor di termini, p deve essere almeno uno affinché \ | \ vec x \ | _p sia una norma . Se 0 <p <1 , quindi \ | \ vec x \ | _p

xp=(i=1d|xi|p)1/p
p=2xy2p=x=supiximaxixipxp0<p<1xp non è davvero una norma, perché le norme devono soddisfare la disuguaglianza del triangolo.

(Esistono anche norme , che sono definite in modo analogo, ad eccezione delle funzioni anziché dei vettori o delle sequenze - in realtà è la stessa cosa, poiché i vettori sono funzioni con domini finiti.)Lp

Non sono a conoscenza di alcun uso per una norma in un'applicazione di apprendimento automatico in cui , tranne dove . Di solito vedi o , o talvolta dove vuoi rilassare il caso ; non è strettamente convesso in , ma è, per . Ciò può rendere la ricerca della soluzione "più semplice" in alcuni casi.p>2p=p=2p=11<p<2p=1x1xxp1<p<

Nel contesto della regolarizzazione, se aggiungi alla tua funzione oggettiva, quello che stai dicendo è che ti aspetti che sia scarso , cioè principalmente costituito da zeri. È un po 'tecnico, ma fondamentalmente, se esiste una soluzione densa , è probabile che esista una soluzione più parsimoniosa con la stessa norma. Se ti aspetti che la tua soluzione sia densa, puoi aggiungere al tuo obiettivo, perché è molto più facile lavorare con la sua derivata. Entrambi hanno lo scopo di evitare che la soluzione abbia un peso eccessivo.x1xx22

La norma mista arriva quando stai cercando di integrare diverse fonti. Fondamentalmente vuoi che il vettore della soluzione sia composto da diversi pezzi , dove è l'indice di qualche sorgente. La è solo la -norm di tutte le -norm raccolte in un vettore. Vale a dire,xjjp,qqp

xp,q=(j=1m(i=1d|xij|p)q/p)1/q

Lo scopo di questo non è quello di "sovradimensionare" un insieme di soluzioni, ad esempio usando . I singoli pezzi sono sparsi, ma non rischi di nuocere un vettore di soluzione intera prendendo il -norm di tutte le soluzioni. Quindi usi invece -norm all'esterno.x1,212

Spero possa aiutare.

Vedi questo documento per maggiori dettagli.


1
+1 per la spiegazione di norme miste. Non li ho mai capiti da solo.
Suresh Venkatasubramanian,

(+1) Bella risposta. Benvenuto in CrossValidated, John!
Martedì
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.