Conversione di beta standardizzati in variabili originali


14

Mi rendo conto che questa è probabilmente una domanda molto semplice ma dopo la ricerca non riesco a trovare la risposta che sto cercando.

Ho un problema in cui devo standardizzare le variabili eseguono la (regressione della cresta) per calcolare le stime della cresta delle beta.

Ho quindi bisogno di riconvertirli nella scala delle variabili originali.

Ma come posso farlo?

Ho trovato una formula per il caso bivariato che

β=β^SxSy.

Questo è stato dato in D. Gujarati, Econometria di base , pagina 175, formula (6.3.8).

Dove sono gli stimatori della corsa di regressione sulle variabili standardizzate e è lo stesso stimatore riconvertito alla scala originale, è la deviazione standard del campione del regresso e è la deviazione standard del campione.ββ^SySx

Sfortunatamente il libro non copre il risultato analogo per la regressione multipla.

Inoltre non sono sicuro di aver capito il caso bivariato? La semplice manipolazione algebrica fornisce la formula per nella scala originale:β^

β^=βSySx

Mi sembra strano che il che sono stati calcolati su variabili che sono già sgonfiate da , debba essere nuovamente sgonfiato da per essere riconvertito? (Inoltre perché i valori medi non vengono aggiunti nuovamente?)β^SxSx

Quindi, qualcuno può spiegare come fare questo per un caso multivariato idealmente con una derivazione in modo che io possa capire il risultato?

Risposte:


26

Per il modello di regressione che utilizza le variabili standardizzate, assumiamo il seguente modulo per la linea di regressione

E[Y]=β0+j=1kβjzj,

dove è il regressore j-esimo (standardizzato), generato da sottraendo la media del campione e dividendo per la deviazione standard del campione : zjxjx¯jSj

zj=xjx¯jSj

Effettuando la regressione con i regressori standardizzati, otteniamo la linea di regressione adattata:

Y^=β^0+j=1kβ^jzj

Desideriamo ora trovare i coefficienti di regressione per i predittori non standardizzati. abbiamo

Y^=β^0+j=1kβ^j(xjx¯jSj)

Riorganizzando, questa espressione può essere scritta come

Y^=(β^0j=1kβ^jx¯jSj)+j=1k(β^jSj)xj

Come possiamo vedere, l'intercetta per la regressione usando le variabili non trasformate è data da . Il coefficiente di regressione del -predittore è .β^0j=1kβ^jx¯jSjjβ^jSj

Nel caso presentato, ho assunto che solo i predittori fossero stati standardizzati. Se si standardizza anche la variabile di risposta, la trasformazione dei coefficienti di covariata nella scala originale viene eseguita utilizzando la formula dal riferimento fornito. Abbiamo:

E[Y]y^Sy=β0+j=1kβjzj

Effettuando la regressione, otteniamo l'equazione di regressione adattata

Y^scaled=Y^unscaledy¯Sy=β^0+j=1kβ^j(xjx¯jSj),

dove i valori adattati sono sulla scala della risposta standardizzata. Per ridimensionarli e recuperare le stime dei coefficienti per il modello non trasformato, moltiplichiamo l'equazione per e portiamo la media campionaria di dall'altra parte:Syy

Y^unscaled=β^0Sy+y¯+j=1kβ^j(SySj)(xjx¯j).

L'intercetta corrispondente al modello in cui né la risposta né i predittori sono stati standardizzati è di conseguenza data da , mentre i coefficienti di covariata per il modello di interesse possono essere ottenuti moltiplicando ogni coefficiente con .β^0Sy+y¯j=1kβ^jSySjx¯jSy/Sj

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.