Ipotesi di LASSO

In uno scenario di regressione LASSO dove

$y= X \beta + \epsilon$ ,

e le stime LASSO sono date dal seguente problema di ottimizzazione

$\min_\beta ||y - X \beta|| + \tau||\beta||_1$

Ci sono ipotesi distributive riguardanti ? $\epsilon$

In uno scenario OLS, ci si aspetterebbe che sia indipendente e normalmente distribuito. $\epsilon$

Ha senso analizzare i residui in una regressione LASSO?

So che la stima di LASSO può essere ottenuta come la modalità posteriore sotto priori indipendenti a doppia esponenziale per il . Ma non ho trovato alcuna "fase di verifica dei presupposti" standard. $\beta_j$

Grazie in anticipo (:

— deps_stats
fonte

Non sono un esperto di LASSO, ma ecco la mia opinione.

Prima nota che OLS è abbastanza robusto per le violazioni di indipendenza e normalità. Quindi, a giudicare dal Teorema 7 e dalla discussione sopra di esso nell'articolo Robust Regression and Lasso (di X. Huan, C. Caramanis e S. Mannor), credo che nella regressione di LASSO non ci occupiamo più della distribuzione di , ma nella distribuzione congiunta di . Il teorema si basa sul presupposto che $\varepsilon_i$ $(y_i,x_i)$ $(y_i,x_i)$ sia un campione, quindi questo è paragonabile alle solite ipotesi OLS. Ma LASSO è meno restrittivo, che non vincola $y_i$ da generare dal modello lineare.

Per riassumere, la risposta alla tua prima domanda è no. Non ci sono ipotesi distributive su , tutte le ipotesi distributive sono su . Inoltre sono più deboli, poiché in LASSO nulla è postulato sulla distribuzione condizionale $\varepsilon$ $(y,X)$ . $(y|X)$

Detto questo, anche la risposta alla seconda domanda è no. Poiché non ha alcun ruolo, non ha senso analizzarli nel modo in cui li analizza in OLS (test di normalità, eteroscedasticità, Durbin-Watson, ecc.). Dovresti comunque analizzarli nel contesto di quanto fosse adatto il modello. $\varepsilon$

— mpiktas
fonte