Come interpretare i coefficienti di regressione quando la risposta è stata trasformata dalla 4a radice?


20

Sto usando la quarta 1/4trasformazione di potenza root ( ) sulla mia variabile di risposta, a causa dell'eteroscedasticità. Ma ora non sono sicuro di come interpretare i miei coefficienti di regressione.

Presumo che avrei bisogno di portare i coefficienti alla quarta potenza quando mi trasformo indietro (vedi sotto l'output di regressione). Tutte le variabili sono espresse in unità di dollari in milioni, ma vorrei conoscere la variazione del dollaro in miliardi.

Pur mantenendo l'altra costante variabile indipendente, una variazione delle commissioni di miliardi di dollari, in media, comporta una variazione di 32(o 32.000 dollari) nelle raccolte. Prendo 0.000075223 * 1000(per arrivare a miliardi) ^ 4 = 0.000032. Ora moltiplico questo numero per 1 milione o 1 miliardo (l'unità originale della variabile dipendente è in milioni)?

lm(formula = (Collections^(1/4)) ~ Fees + DIR)

                 Estimate      Std. Error  t value            Pr(>|t|)
(Intercept)   2.094573355     0.112292375   18.653  0.0000000000000151
Fees        **0.000075223   **0.000008411    8.943  0.0000000131878713
DIR           0.000022279     0.000004107    5.425  0.0000221138881913

Risposte:


24

La soluzione migliore è, all'inizio, scegliere una reespressione che abbia un significato nel campo di studio.

(Ad esempio, quando si regredisce il peso corporeo rispetto a fattori indipendenti, è probabile che venga indicata una radice cubica ( potenza) o una radice quadrata ( potenza). Notando che il peso è un buon proxy per il volume, il cubo la radice è una lunghezza che rappresenta una caratteristica dimensione lineare. Ciò le conferisce un significato intuitivo, potenzialmente interpretabile. Sebbene la radice quadrata stessa non abbia una tale chiara interpretazione, è vicina alla potenza di , che ha dimensioni della superficie : potrebbe corrispondere alla superficie totale della pelle.)1 / 2 2 / 31/31/22/3

La quarta potenza è sufficientemente vicina al logaritmo che dovresti considerare di usare invece il registro , i cui significati sono ben compresi. Ma a volte troviamo davvero che una radice cubica o una radice quadrata o un tale potere frazionario fa un ottimo lavoro e non ha un'interpretazione ovvia. Quindi, dobbiamo fare un po 'di aritmetica.

Il modello di regressione mostrato nella domanda riguarda una variabile dipendente ("Collezioni") e due variabili indipendenti ("Commissioni") e ("DIR"). Lo poneX 1 X 2YX1X2

Y1/4=β0+β1X1+β2X2+ε.

Il codice stima come , come e come . Presume anche che i siano normali con zero media e stima la loro varianza comune (non mostrata). Con queste stime, il valore adattato di èb 0 = 2,094,573355 millions β 1 b 1 = ,000,075223 millions β 2 b 2 = ,000,022279 millions ε Y 1 / 4β0B0=2,094,573355 millionsβ1B1=,000,075223 millionsβ2B2=,000,022279 millionsεY1/4

Y1/4^=B0+B1X1+B2X2.

"Interpretazione" dei coefficienti di regressione normalmente significa determinare quale cambiamento nella variabile dipendente è suggerito da un dato cambiamento in ciascuna variabile indipendente. Queste modifiche sono le derivate , che secondo la Chain Rule sono pari a . Quindi inseriremo le stime e dire qualcosa di simile 4 β i Y 3dY/dXio4βioY3

La regressione stima che una variazione di unità in sarà associata a una variazione in di = . Y 4 b i Y 3 4 b i ( b 0 + bXioY4BioY^34Bio(B0+B1X1+B2X2)3

La dipendenza dell'interpretazione su e non è semplicemente espressa in parole, aX 2X1X2 differenza delle situazioni senza trasformazione di (una variazione di unità in è associata a una variazione di in ) o con il logaritmo (variazione % in è associato alla variazione del percento in ). Tuttavia, mantenendo la prima forma dell'interpretazione e calcolando = = , potremmo dichiarare qualcosa di simile X i b i Y X i b i YYXioBioYXioBioY4B14×,000,075223 millions0.000301

Una variazione unitaria delle commissioni è associata a una variazione delle raccolte pari a volte il cubo delle raccolte correnti; ad esempio, se le raccolte correnti sono , un aumento unitario delle commissioni è associato ad un aumento di nelle raccolte e se le raccolte correnti sono , lo stesso aumento unitario delle commissioni è associato ad un aumento di nelle raccolte.0.000301100,301202.41


Quando si prendono radici diverse dalla quarta - diciamo, quando si usa come risposta anziché stessa, con diverso da zero - è sufficiente sostituire tutte le apparenze di " " in questa analisi con " ". YpYp41/p


12

Un'alternativa alla trasformazione qui è usare un modello lineare generalizzato con funzione link power e power 1/4. Quale famiglia di errori usare è aperta, il che ti dà più flessibilità di quella che hai con una regressione lineare e un'ipotesi di normalità condizionale. Un grande vantaggio di questa procedura è che le previsioni vengono prodotte automaticamente sulla scala di misurazione originale, quindi non si tratta di back-trasforming.


4

Ho visto documenti che utilizzano coefficienti di regressione della radice quartica nel pensare ai cambiamenti percentuali, evitando al contempo di prendere tronchi (e rilasciare osservazioni).

Se siamo interessati a utilizzare le radici quartiche per calcolare le variazioni percentuali, sappiamo che:

Y^=(α+β^1X1+β^2X2)4dY^dX1=4β^1(α+β^1X1+β^2X2)3

YXX

dY^/dX1Y=4β^1α+β^1X1+β^2X2

YX

dY^dX1X1Y^=4β^1X1α+β^1X1+β^2X2

X

Y1/4

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.