Mi sto davvero interessando alla procedura della rete elastica per la riduzione / selezione del predittore. Sembra molto potente.
Ma dal punto di vista scientifico non so bene cosa fare una volta ottenuti i coefficienti. A quale domanda sto rispondendo? Queste sono le variabili che influenzano maggiormente questo risultato e questi sono i coefficienti che danno il miglior rapporto varianza / bias durante la validazione?
Questo è ovviamente un approccio molto descrittivo / predittivo rispetto all'approccio classico con intervalli di valore / confidenza. La stima inferenziale è attualmente allo studio di Tibshirani & Co. ma è ancora sperimentale.
Alcune persone stanno usando le variabili scelte dalla rete elastica per eseguire la classica analisi inferenziale, ma ciò eliminerebbe la limitazione di varianza introdotta dalla tecnica.
Un altro problema è che poiché i parametri lambda e alfa per la rete elastica sono scelti mediante validazione incrociata, sono soggetti a variabilità casuale. Quindi ogni volta che esegui (es.) Cv.glmnet () selezionerai un sottoinsieme leggermente diverso di predittori con coefficienti sempre diversi.
Ho pensato di risolverlo considerando la giusta lambda e alfa come variabili casuali e rieseguire il passaggio di convalida incrociata n volte per ottenere una distribuzione di questi parametri. In questo modo per ogni predittore avrei il numero di occorrenze e per ogni coefficiente avrei distribuzione dei risultati. Questo dovrebbe darmi risultati più generalizzabili con statistiche sugli intervalli (come sd dei coefficienti). Sarebbe anche interessante vedere se la lambda e l'alfa scegliessero in questo modo approssimativamente una certa distribuzione asintoticamente, poiché ciò aprirebbe la strada a qualche test di inferenza (ma non sono uno statistico quindi non dovrei parlare di cose che non capisco bene).
Quindi alla fine la mia domanda è: una volta ottenuti i predittori e i coefficienti da una rete elastica con alpha e lambda basati sulla validazione incrociata, quale e come dovresti presentare questi risultati? Come dovresti discuterne? che cosa abbiamo imparato? Quale ipotesi / generalizzazione stiamo confutando?