Confusione legata alla normalizzazione dei dati


9

Sto cercando di imparare un modello di regressione lineare. Tuttavia, ho qualche confusione legata alla normalizzazione dei dati. Ho normalizzato le caratteristiche / i predittori a zero varianza media e unità. Devo fare lo stesso per l'obiettivo. Se sì, perché?


1
Perché hai normalizzato le funzionalità / i predittori?
Peter Flom

4
A proposito, penso che "standardizzare" sia un termine migliore per questo.
Scortchi - Ripristina Monica

Risposte:


6

La normalizzazione del target nella regressione lineare non ha importanza. Nella regressione lineare, il tuo adattamento sarà della forma Quando i predittori sono centrati, il termine costante sarà sempre la media di . Quindi, se prima di eseguire una regressione, otterrete semplicemente , ma tutti gli altri vostri coefficienti rimarranno invariati.

y^io=un'0+un'Xio.
Xioun'0yioyioun'0=0

(Detto questo, normalizzare i predittori --- come stai attualmente facendo --- è una buona idea.)


1
Perché normalizzare i predittori è una buona idea?
Scortchi - Ripristina Monica

@Stefan. Sì, quando centro i predittori, ottengo il termine costante come media di y. Ma non ho capito come mai diventa il cattivo. Puoi dirmi i calcoli alla base? un'0
user34790,

2
@Scortchi La normalizzazione dei predittori non è necessaria, ma può rendere più semplice l'interpretazione dei coefficienti dalla regressione: dopo la normalizzazione, i grandi coefficienti corrispondono a predittori importanti. Inoltre, senza normalizzazione, i coefficienti dei termini di interazione possono essere seriamente fuorvianti. Detto questo, la normalizzazione non influirà sulle previsioni ottenute dal modello, quindi la normalizzazione è importante solo se si intende interpretare i coefficienti nella regressione.
Stefan Wager,

1
@ user34790 La matematica è risolta
Stefan Wager

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.