Trasformazione posteriore di coefficienti di regressione


17

Sto facendo una regressione lineare con una variabile dipendente trasformata. La seguente trasformazione è stata fatta in modo tale da sostenere il presupposto della normalità dei residui. La variabile dipendente non trasformata era distorta negativamente e la seguente trasformazione la rendeva quasi normale:

Y=50Yorig

dove è la variabile dipendente sulla scala originale.Yorig

Penso che abbia senso usare alcune trasformazioni sui coefficienti per tornare alla scala originale. Utilizzando la seguente equazione di regressione,β

Y=50Yorig=α+βX

e fissando , abbiamoX=0

α=50Yorig=50αorig

E infine,

αorig=50α2

Usando la stessa logica, ho trovato

βorig=α (α2β)+β2+αorig50

Ora le cose funzionano molto bene per un modello con 1 o 2 predittori; i coefficienti trasformati all'indietro assomigliano a quelli originali, solo ora posso fidarmi degli errori standard. Il problema si presenta quando si include un termine di interazione, come ad esempio

Y=α+X1βX1+X2βX2+X1X2βX1X2

Quindi la back-trasformazione per i β non è così vicina a quelli della scala originale, e non sono sicuro del perché ciò accada. Non sono inoltre sicuro se la formula trovata per la trasformazione a ritroso di un coefficiente beta sia utilizzabile come per la terza β (per il termine di interazione). Prima di entrare in una folle algebra, ho pensato di chiedere un consiglio ...


Come definisci e ? β o r i gαorigβorig
mark999,

Come valore di alpha e beta sulle scale originali
Dominic Comtois,

1
Ma cosa significa?
mark999,

Rischerei qualcosa del genere: le stime che avremmo ottenuto erano i dati originali adatti alla regressione lineare.
Dominic Comtois,

2
A me sembra un concetto insignificante. Sono d'accordo con la risposta di Gung.
mark999,

Risposte:


19

Un problema è che hai scritto

Y=α+βX

Questo è un semplice modello deterministico (cioè non casuale). In tal caso, si potrebbe tornare trasformare i coefficienti sulla scala originale, dal momento che è solo una questione di qualche semplice algebra. Ma, nella solita regressione, hai solo ; hai lasciato il termine di errore fuori dal tuo modello. Se la trasformazione da a non è lineare, potresti avere un problema poiché , in generale. Penso che potrebbe avere a che fare con la discrepanza che stai vedendo.E(Y|X)=α+βXYYorigE(f(X))f(E(X))

Modifica: si noti che se la trasformazione è lineare, è possibile tornare indietro per ottenere stime dei coefficienti sulla scala originale, poiché l'aspettativa è lineare.


4
+1 per spiegare perché non possiamo tornare indietro a trasformare i beta.
gung - Ripristina Monica

15

Saluto i tuoi sforzi qui, ma stai abbaiando sull'albero sbagliato. Non trasformi indietro beta. Il tuo modello è valido nel mondo dei dati trasformati. Se si desidera fare una previsione, ad esempio, si torna a trasformare , ma il gioco è fatto. Naturalmente, puoi anche ottenere un intervallo di predizione calcolando i valori limite alto e basso, e poi anche trasformarli indietro, ma in nessun caso trasformi indietro i beta. y^i


1
Cosa fare del fatto che i coefficienti retro-trasformati si avvicinano molto a quelli ottenuti quando si modella la variabile non trasformata? Ciò non consente alcune deduzioni sulla scala originale?
Dominic Comtois,

2
Non lo so esattamente. Potrebbe dipendere da un numero qualsiasi di cose. La mia prima ipotesi è che stai diventando fortunato con la tua prima coppia di beta, ma poi la tua fortuna si esaurisce. Sono d'accordo con w / @ mark999 che "le stime che avremmo ottenuto fossero i dati originali adatti alla regressione lineare" non hanno alcun senso; Vorrei che lo facesse e in un certo senso sembra arrossire, ma sfortunatamente no. E non autorizza alcuna inferenza sulla scala originale.
gung - Ripristina Monica

1
@gung per trasformazioni non lineari (diciamo box cox): posso ritrasmettere sia i valori adattati che gli intervalli di predizione, ma non riesco a trasformare i beta né gli intervalli dei coefficienti per i beta. C'è qualche limitazione aggiuntiva di cui dovrei essere a conoscenza? a proposito, questo è un argomento molto interessante, dove posso capire meglio?
Mugen,

2
@mugen, è difficile dire cos'altro dovresti essere a conoscenza. Una cosa che forse dovresti tenere a mente è che la trasformazione posteriore di y-hat ti dà la mediana condizionale, mentre il y-hat trasformato non-back (bleck) è il mezzo condizionale. A parte questo, questo materiale dovrebbe essere trattato in un buon libro di testo di regressione.
gung - Ripristina Monica

3
@mugen, prego. Sentiti libero di porre più domande tramite i normali meccanismi (clic ASK QUESTION); ci saranno più risorse per rispondere, attirerai l'attenzione di più CVer e le informazioni saranno meglio accessibili ai posteri.
gung - Ripristina Monica
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.