Ipotesi di LASSO


18

In uno scenario di regressione LASSO dove

y=Xβ+ϵ ,

e le stime LASSO sono date dal seguente problema di ottimizzazione

minβ||yXβ||+τ||β||1

Ci sono ipotesi distributive riguardanti ?ϵ

In uno scenario OLS, ci si aspetterebbe che sia indipendente e normalmente distribuito.ϵ

Ha senso analizzare i residui in una regressione LASSO?

So che la stima di LASSO può essere ottenuta come la modalità posteriore sotto priori indipendenti a doppia esponenziale per il . Ma non ho trovato alcuna "fase di verifica dei presupposti" standard.βj

Grazie in anticipo (:

Risposte:


16

Non sono un esperto di LASSO, ma ecco la mia opinione.

Prima nota che OLS è abbastanza robusto per le violazioni di indipendenza e normalità. Quindi, a giudicare dal Teorema 7 e dalla discussione sopra di esso nell'articolo Robust Regression and Lasso (di X. Huan, C. Caramanis e S. Mannor), credo che nella regressione di LASSO non ci occupiamo più della distribuzione di , ma nella distribuzione congiunta di ( y i , x i ) . Il teorema si basa sul presupposto che ( y i , x i )εi(yi,xi)(yi,xi) sia un campione, quindi questo è paragonabile alle solite ipotesi OLS. Ma LASSO è meno restrittivo, che non vincola yi da generare dal modello lineare.

Per riassumere, la risposta alla tua prima domanda è no. Non ci sono ipotesi distributive su , tutte le ipotesi distributive sono su ( y , X ) . Inoltre sono più deboli, poiché in LASSO nulla è postulato sulla distribuzione condizionale ( y | Xε(y,X) .(y|X)

Detto questo, anche la risposta alla seconda domanda è no. Poiché non ha alcun ruolo, non ha senso analizzarli nel modo in cui li analizza in OLS (test di normalità, eteroscedasticità, Durbin-Watson, ecc.). Dovresti comunque analizzarli nel contesto di quanto fosse adatto il modello.ε

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.