Nel rilevamento compresso, c'è una garanzia teorema che ha una soluzione sparsa unica c (Vedi appendice per maggiori dettagli).
Esiste un teorema simile per il lazo? Se esiste un tale teorema, non solo garantirà la stabilità del lazo, ma fornirà anche al lazo un'interpretazione più significativa:
il lazo può scoprire il vettore di coefficiente di regressione sparso utilizzato per generare la risposta per .
Ci sono due motivi per cui faccio questa domanda:
Penso che "il lazo favorisca una soluzione sparsa" non è una risposta al motivo per cui utilizzare il lazo per la selezione delle funzioni poiché non possiamo nemmeno dire quale sia il vantaggio delle funzionalità che selezioniamo.
Ho imparato che il lazo è noto per essere instabile per la selezione delle funzionalità. In pratica, dobbiamo eseguire campioni bootstrap per valutarne la stabilità. Qual è la ragione più cruciale che causa questa instabilità?
Appendice:
Dato . è un -sparse Consente di vettore ( ). Il processo genera la risposta . Se ha l'NSP (proprietà spazio nullo) di ordine e la matrice di covarianza di non ha autovalore vicino a zero, ci sarà una soluzione unica a
Ciò che dice questo teorema è anche se non ha l'NSP di ordine , è semplicemente senza speranza risolvere .
MODIFICARE:
Dopo aver ricevuto queste grandi risposte, mi sono reso conto di essere confuso quando stavo facendo questa domanda.
Perché questa domanda è confusa:
Ho letto un documento di ricerca in cui dobbiamo decidere quante funzioni (colonne) avrà la matrice di progettazione (le funzioni ausiliarie vengono create dalle funzioni primarie). Poiché si tratta di un tipico problema , si prevede che sia ben costruito in modo che la soluzione al lazo possa essere una buona approssimazione della soluzione reale sparsa.
Il ragionamento è tratto dal teorema che ho citato nell'appendice: Se miriamo a trovare una soluzione sparsa - , è meglio avere l'NSP di ordine .
Per una matrice generale , se viene violata , allora
non è possibile alcun recupero stabile e robusto di da e
corrisponde a , corrisponde a
... come previsto dalla relazione , la selezione del descrittore diventa più instabile, ovvero, per diversi set di allenamento, il descrittore selezionato spesso differisce ...
La seconda citazione è la parte che mi confonde. Mi sembra che quando viene violata la disuguaglianza, non è solo la soluzione forse non unica (non menzionata), ma il descrittore diventerà anche più instabile.