Attualmente sto prendendo la mia prima classe di regressione lineare applicata a livello di laurea e sto lottando con le trasformazioni delle variabili predittive in regressione lineare multipla. Il testo che sto usando, Kutner et al "Modelli statistici lineari applicati" non sembra coprire la domanda che sto avendo. (oltre a suggerire che esiste un metodo Box-Cox per trasformare più predittori).
Di fronte a una variabile di risposta e diverse variabili predittive, quali condizioni si cerca di soddisfare con ciascuna variabile predittore? Capisco che alla fine stiamo cercando la costanza della varianza degli errori e degli errori normalmente distribuiti (almeno nelle tecniche che mi sono state insegnate finora.) Ho avuto molti esercizi di ritorno, dove la soluzione era, ad esempio y ~ x1 + (1/x2) + log(x3)
, in cui uno o più predittori sono stati trasformati.
Ho compreso la logica in base alla semplice regressione lineare, poiché era facile osservare y ~ x1 e la relativa diagnostica (grafici qq di residui, residui vs y, residui vs x, ecc.) E verificare se y ~ log ( x1) si adattano meglio ai nostri presupposti.
C'è un buon posto per iniziare a capire quando trasformare un predittore in presenza di molti predittori?
Grazie in anticipo. opaco