Zou et al. "Sui" gradi di libertà "del lazo" (2007) mostrano che il numero di coefficienti diversi da zero è una stima imparziale e coerente per i gradi di libertà del lazo.
Mi sembra un po 'controintuitivo.
- Supponiamo di avere un modello di regressione (dove le variabili sono zero media)
- Supponiamo che una stima OLS senza restrizioni di sia . Potrebbe approssimativamente coincidere con una stima LASSO di per un'intensità di penalità molto bassa.β O L S = 0.5 β
- Supponiamo inoltre che una stima LASSO per una particolare intensità di penalità sia . Ad esempio, potrebbe essere l '"ottimale" per il set di dati disponibile trovato utilizzando la convalida incrociata. * β L A S S O , λ * = 0.4 λ * λ
- Se ho capito bene, in entrambi i casi il grado di libertà è 1 dato che entrambe le volte c'è un coefficiente di regressione diverso da zero.
Domanda:
- Come mai i gradi di libertà in entrambi i casi sono gli stessi anche se suggerisce meno "libertà" di ? β OLS=0.5
Riferimenti:
- Zou, Hui, Trevor Hastie e Robert Tibshirani. "Sui" gradi di libertà "del lazo." The Annals of Statistics 35.5 (2007): 2173-2192.