KKT contro formulazione non vincolata della regressione del lazo


20

La regressione penalizzata L1 (aka lazo) è presentata in due formulazioni. Lascia che le due funzioni obiettivo siano

Q1=12||YXβ||22Q2=12||YXβ||22+λ||β||1.
Quindi le due diverse formulazioni sono
argminβQ1
soggetto a
||β||1t,
e, equivalentemente
argminβQ2.
Usando le condizioni di Karush-Kuhn-Tucker (KKT), è facile vedere come la condizione di stazionarietà per la prima formulazione equivale a prendere il gradiente della seconda formulazione e impostarlo uguale a 0. Cosa non riesco a trovare, né capire , è come la condizione di allentamento complementare per la prima formulazione,λ(||β||1t)=0 , è garantita per essere soddisfatta dalla soluzione alla seconda formulazione.

Risposte:


16

Le due formulazioni sono equivalenti nel senso che per ogni valore di t nella prima formulazione, esiste un valore di λ per la seconda formulazione in modo tale che le due formulazioni abbiano lo stesso minimizzatore β .

Ecco la giustificazione:

Considera la formulazione del lazo: Lascia che il minimizer siaβe cheb=| | β| | 1. La mia affermazione è che se si impostat=bnella prima formulazione, anche la soluzione della prima formulazione saràβ. Ecco la prova:

f(β)=12||YXβ||22+λ||β||1
βb=||β||1t=bβ

Considera la prima formulazione Se possibile lasciare che questa seconda formulazione ha una soluzione β tale che| | ß | | 1<| | β| | 1=b(notare il segno strettamente minore di). Allora è facile vedere chef( β )<f(β

min12||YXβ||22 s.t.||β||1b
β^||β^||1<||β||1=b contraddicendo il fatto che β è una soluzione per il lazo. Pertanto, anche la soluzione alla prima formulazione è β .f(β^)<f(β)ββ

Poiché , la condizione di allentamento complementare è soddisfatta nel punto di soluzione β .t=bβ

Quindi, data una formulazione del lazo con , costruisci una formulazione vincolata usando una t uguale al valore della norma l 1 della soluzione del lazo. Viceversa, data una formulazione vincolata con t , si trova un λ tale che la soluzione al lazo sarà uguale alla soluzione della formulazione vincolata.λtl1tλ

(Se conosci i laureandi, puoi trovare questo risolvendo l'equazione X T ( y - X β ) = λ z , dove z | | β | | 1 )λXT(yXβ)=λzz||β||1)


1
Eccellente. Quando vedi la soluzione ti senti sempre stupido per non esserti arrivato da solo. Presumo che dire, a trovare la contraddizione, si supponga troviamo un β tale che | | ß | | 1 < | | β | | 1 = b ? β^||β^||1<||β||1=b
goodepic

Considera la risposta flaggin come corretta
bdeonovic

2
si può elaborare il motivo per cui f(β^)<f(β)
goofd

Ciò dimostra che la soluzione alla prima formulazione deve avere anche una norma l1 di b. Come dimostra che le due soluzioni sono effettivamente le stesse?
bronco

1
Inoltre, il Lasso non ha sempre una soluzione unica, quindi non possiamo fare riferimento alla Minimizer. arxiv.org/pdf/1206.0313.pdf . Potremmo, tuttavia, fare riferimento all'insieme dei minimi e mostra che alcuni ßß * devono appartenere a tale insieme. β^β
Bronco Australia

3

Penso che l'idea di elexhobby per questa dimostrazione sia valida, ma non credo sia del tutto corretta.

Nel mostrare che l'esistenza di una soluzione per la prima , in modo che β< β * porta ad una contraddizione, possiamo solo supporre la necessità di β= β * , non che β = β * .β^β^<ββ^=ββ^=β

Suggerisco invece di procedere come segue:

Per comodità, denotiamo con e P 2 rispettivamente la prima e la seconda formulazione. Supponiamo che P 2 abbia una soluzione unica, β , con β = b . Lasciare P 1 ha una soluzione, ßß * . Poi, abbiamo che ββ * (non può essere maggiore a causa del vincolo) e quindi f ( β )P1P2P2ββ=bP1β^ββ^β . Se f ( β ) < f ( β * ) , allora β * non è la soluzione al P 2 , che contraddice nostre ipotesi. Se f ( β ) = f ( β * ) , allora β = β * , poiché abbiamo assunto la soluzione per essere unico.f(β^)f(β)f(β^)<f(β)βP2f(β^)=f(β)β^=β

Tuttavia, è possibile che il Lazo abbia più soluzioni. Con il lemma 1 di arxiv.org/pdf/1206.0313.pdf sappiamo che tutte queste soluzioni hanno lo stesso -norm (e lo stesso valore minimo, ovviamente). Impostiamo quella norma come vincolo per la P 1 e procediamo.1P1

Denote di Let dalla l'insieme delle soluzioni di P 2 , con β = b β S . Sia P 1 ha una soluzione, ßS . Poi, abbiamo che ββ β S e quindi f ( β ) f ( β ) β S . Se fSP2β=b βSP1β^Sβ^ββSf(β^)f(β)βS per qualche β S (e quindi per tutti) allora βS , che contraddice nostre ipotesi. Se f ( β ) < f ( β ) per qualche β S allora S non è l'insieme di soluzioni di P 2 . Pertanto, ogni soluzione a P 1 è in S , cioè qualsiasi soluzione a P 1f(β^)=f(β)βSβ^Sf(β^)<f(β)βSSP2P1SP1è anche una soluzione a . Rimarrebbe da dimostrare che vale anche il complemento.P2

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.