Dubito seriamente se centrare o standardizzare i dati originali potrebbe davvero mitigare il problema della multicollinearità quando nella regressione sono inclusi termini quadrati o altri termini di interazione, come alcuni di voi, in particolare il gung, hanno raccomandato sopra.
Per illustrare il mio punto, consideriamo un semplice esempio.
Supponiamo che le specifiche vere assumano la forma seguente in modo tale
yi=b0+b1xi+b2x2i+ui
Pertanto, l'equazione OLS corrispondente è data da
yi=yi^+ui^=b0^+b1^xi+b2^x2i+ui^
yi^yiuib0^b2^b0b2zi=x2i
xx2yiyi
yi
y¯=b0^+b1^x¯+b2^z¯
y¯x¯z¯yixizi
y¯yi
yi−y¯=b1^(xi−x¯)+b2^(zi−z¯)+ui^
yi−y¯xi−x¯zi−z¯b1^b2^
xx2xx2corr(x,z)=corr(x−x¯,z−z¯)
In sintesi, se la mia comprensione del centraggio è corretta, allora non credo che i dati di centraggio farebbero alcun aiuto per mitigare il problema MC causato dall'inclusione dei termini al quadrato o di altri termini di ordine superiore nella regressione.
Sarei felice di sentire le tue opinioni!