Bene, c'è un metodo ad hoc che ho usato prima. Non sono sicuro che questa procedura abbia un nome ma abbia un senso intuitivo.
Supponiamo che il tuo obiettivo sia quello di adattare il modello
Yi=β0+β1Xi+β2Zi+εi
dove i due predittori - - sono altamente correlati. Come hai sottolineato, usarli entrambi nello stesso modello può fare cose strane per le stime dei coefficienti e i valori . Un'alternativa è quella di adattarsi al modello pXi,Zip
Zi=α0+α1Xi+ηi
Quindi il residuo non sarà correlato con e può, in un certo senso, essere pensato come la parte di che non è inclusa nella sua relazione lineare con . Quindi, è possibile procedere per adattarsi al modelloX i Z i X iηiXiZiXi
Yi=θ0+θ1Xi+θ2ηi+νi
che catturerà tutti gli effetti del primo modello (e, in effetti, avrà esattamente lo stesso del primo modello) ma i predittori non sono più collineari.R2
Modifica: l'OP ha chiesto una spiegazione del perché i residui non hanno, in via definitiva, una correlazione di esempio zero con il predittore quando si omette l'intercettazione come fanno quando l'intercettazione è inclusa. È troppo lungo per pubblicare un commento, quindi ho fatto una modifica qui. Questa derivazione non è particolarmente illuminante (purtroppo non sono riuscito a trovare un argomento intuitivo ragionevole) ma mostra ciò che l'OP ha richiesto :
Quando l'intercettazione viene omessa in una semplice regressione lineare , , quindi . La correlazione di esempio tra ed è proporzionale a dove indica la media campionaria della quantità sotto la barra. Ora mostrerò che questo non è necessariamente uguale a zero. ei=yi-xi∑xiyiβ^=∑xiyi∑x2i xiei ¯ x e - ¯ x ¯ e ¯ ⋅ei=yi−xi∑xiyi∑x2ixiei
xe¯¯¯¯¯−x¯¯¯e¯¯¯
⋅¯
Per prima cosa abbiamo
xe¯¯¯¯¯=1n(∑xiyi−x2i⋅∑xiyi∑x2i)=xy¯¯¯¯¯(1−∑x2i∑x2i)=0
ma
x¯¯¯e¯¯¯=x¯¯¯(y¯¯¯−x¯¯¯⋅xy¯¯¯¯¯x2¯¯¯¯¯)=x¯¯¯y¯¯¯−x¯¯¯2⋅xy¯¯¯¯¯x2¯¯¯¯¯
quindi, affinché e abbiano una correlazione di esempio esattamente pari a 0, è necessario che sia . Cioè, abbiamo bisogno dieixix¯¯¯e¯¯¯0
y¯¯¯=x¯¯¯⋅xy¯¯¯¯¯x2¯¯¯¯¯
che non vale in generale per due serie arbitrarie di dati .x,y