Prendi in considerazione la regressione lineare con una certa regolarizzazione: ad esempio Trova che minimizza| | A x - b | | 2 + λ | | x | | 1
Di solito, le colonne di A sono standardizzate per avere media zero e norma unitaria, mentre è centrata per avere media zero. Voglio assicurarmi che la mia comprensione del motivo della standardizzazione e centratura sia corretta.
Rendendo i mezzi delle colonne di e zero, non abbiamo più bisogno di un termine di intercettazione. Altrimenti, l'obiettivo sarebbe stato . Rendendo le norme delle colonne di A pari a 1, eliminiamo la possibilità di un caso in cui solo perché una colonna di A ha una norma molto alta, ottiene un basso coefficiente in , che potrebbe portarci a concludere erroneamente che quella colonna di A non "spiega" bene.b | | A x - x 0 1 - b | | 2 + λ | | x | | 1 x x
Questo ragionamento non è esattamente rigoroso ma intuitivo, è questo il modo giusto di pensare?
$x$ does not ''explain'' $A$ well
e intendix does not ''explain'' $A$ at all
? sono i dati mentre è il modello in questo caso. x