Probabilmente sto affrontando un problema che è stato probabilmente risolto centinaia di volte prima, ma non sono sicuro di dove trovare la risposta.
Quando si utilizza la regressione logistica, date molte funzioni e si cerca di prevedere un valore categorico binario , sono interessato a selezionare un sottoinsieme delle funzionalità che prevede bene .
Esiste una procedura simile al lazo che può essere utilizzata? (Ho visto solo il lazo usato per la regressione lineare.)
Guardare i coefficienti del modello montato è indicativo dell'importanza delle diverse caratteristiche?
Modifica - Chiarimenti dopo aver visto alcune delle risposte:
Quando mi riferisco all'entità dei coefficienti adattati, intendo quelli che sono adattati alle caratteristiche normalizzate (media 0 e varianza 1). Altrimenti, come sottolineato da @probabilityislogic, 1000x sembrerebbe meno importante di x.
Non mi interessa semplicemente trovare il miglior sottoinsieme k (come offriva @Davide), ma piuttosto valutare l'importanza delle diverse funzionalità l'una rispetto all'altra. Ad esempio, una funzione potrebbe essere "età" e l'altra funzione "età> 30". La loro importanza incrementale potrebbe essere scarsa, ma entrambe potrebbero essere importanti.