Sto usando Lazo per la selezione delle caratteristiche in un'impostazione dimensionale relativamente bassa (n >> p). Dopo aver montato un modello Lazo, voglio usare le covariate con coefficienti diversi da zero per adattarlo a un modello senza penalità. Lo sto facendo perché voglio stime imparziali che Lasso non può darmi. Vorrei anche valori p e intervalli di confidenza per la stima imparziale.
Ho problemi a trovare letteratura su questo argomento. La maggior parte della letteratura che trovo riguarda l'inserimento di intervalli di confidenza nelle stime di Lasso, non un modello modificato.
Da quello che ho letto, semplicemente il refitting di un modello usando l'intero set di dati porta a valori p / errori std irragionevolmente piccoli. In questo momento, la suddivisione del campione (nello stile di Wasserman e Roeder (2014) o Meinshausen et al. (2009)) sembra essere un buon corso d'azione, ma sto cercando altri suggerimenti.
Qualcuno ha riscontrato questo problema? In tal caso, potresti fornire alcuni suggerimenti.