La regressione della cresta può essere espressa come dove è l'etichetta prevista , la identifica, l'oggetto per cui stiamo cercando di trovare un'etichetta e la matrice di oggetti tale che: y Idd×dxXn×dnxi=(xi,1,...,Xi,d)∈Rd
Possiamo creare il kernel nel modo seguente:
dove è la matrice delle funzioni del kernel n×nK
e il vettore colonna delle funzioni del kernel n × 1 K
Domande:
(a) se ci sono più oggetti rispetto alle dimensioni, ha senso non usare i kernel? Ad esempio, sarà una matrice , quindi sarà una e finiremo per invertire una matrice invece della matrici dovremmo invertire se dovessimo usare i kernel. Questo significa che se non dovremmo usare i kernel?X 50×3 X ′ X 3×33×350×50d≤n
(b) dovrebbe essere usato il kernel più semplice possibile? Sembra che i kernel nella regressione della cresta vengano utilizzati per negare le influenze della dimensionalità e non utilizzare determinate proprietà dello spazio delle caratteristiche (a differenza delle macchine vettoriali di supporto). Tuttavia, i kernel possono modificare le distanze tra gli oggetti, quindi ci sono spesso kernel popolari usati nella regressione della cresta?
(c) qual è la complessità temporale della regressione della cresta e / o della regressione della cresta del kernel?