Le variabili di spostamento / ridimensionamento non influiranno sulla loro correlazione con la risposta
Per capire perché questo è vero, supponiamo che la correlazione tra e sia . Quindi la correlazione tra e èX ρ Y ( X - a ) / bYXρY( X- a ) / b
c o v (Y, ( X- a ) / b )S D ((X- a ) / b ) ⋅ S D ( Y)= c o v ( Y, X/ b)S D (X/ b)⋅ S D (Y)= 1B⋅ c o v ( Y, X)1BS D (X) ⋅ S D ( Y)= ρ
che segue dalla definizione di correlazione e tre fatti:
c o v (Y, X+ a ) = c o v ( Y, X) + c o v ( Y, a )= 0= c o v ( Y, X)
c o v (Y, una X) = a c o v ( Y, X)
S D (unaX) = a ⋅ S D ( X)
Pertanto, in termini di adattamento del modello (ad es. o valori adattati), spostare o ridimensionare le variabili (ad es. Inserendole sulla stessa scala) non cambierà il modelloR2 , poiché i coefficienti di regressione lineare sono correlati alle correlazioni tra variabili. Cambierà solo la scala dei coefficienti di regressione , che dovrebbe essere tenuta presente quando si interpreta l'output se si sceglie di trasformare i propri predittori.
Modifica: quanto sopra ha assunto che stai parlando della regressione ordinaria con l'intercettazione. Un altro paio di punti relativi a questo (grazie @cardinal):
L'intercettazione può cambiare quando trasformi le tue variabili e, come sottolinea @cardinal nei commenti, i coefficienti cambieranno quando sposti le variabili se ometti l'intercetta dal modello, anche se presumo che non lo stai facendo a meno che tu non lo abbia fatto una buona ragione (vedi ad esempio questa risposta ).
Se stai regolarizzando i tuoi coefficienti in qualche modo (es. Lazo, regressione della cresta), la centratura / ridimensionamento influiranno sull'adattamento. Ad esempio, se stai penalizzando (la penalità di regressione della cresta), non puoi recuperare un adattamento equivalente dopo la standardizzazione a meno che tutte le variabili non fossero sulla stessa scala in primo luogo, cioè non esiste un multiplo costante che recupererà la stessa penalità.∑ β2io
Per quanto riguarda quando / perché un ricercatore potrebbe voler trasformare i predittori
Una circostanza comune (discussa nella successiva risposta di @Paul) è che i ricercatori standardizzeranno i loro predittori in modo che tutti i coefficienti siano sulla stessa scala. In tal caso, la dimensione delle stime puntuali può dare un'idea approssimativa di quali fattori predittivi abbiano l'effetto maggiore una volta che l'entità numerica del predittore è stata standardizzata.
Un altro motivo per cui un ricercatore potrebbe voler ridimensionare variabili molto grandi è che i coefficienti di regressione non sono su una scala estremamente piccola. Ad esempio, se si desidera esaminare l'influenza della dimensione della popolazione di un paese sul tasso di criminalità (non si potrebbe pensare a un esempio migliore), si potrebbe voler misurare la dimensione della popolazione in milioni anziché nelle sue unità originali, dal momento che il coefficiente potrebbe essere qualcosa come ..00000001