I due modelli che hai elencato nella tua risposta possono essere ri-espressi per chiarire in che modo si postula che l'effetto di dipenda da (o viceversa) in ciascun modello.X1X2
Il primo modello può essere ri-espresso in questo modo:
Y=β0+(β1+β3X2)X1+β2X2+ϵ,
il che dimostra che, in questo modello, si presume che abbia un effetto lineare su (controllando l'effetto di ) ma l'entità di questo effetto lineare - catturato dal coefficiente di pendenza di - cambia linearmente in funzione di . Ad esempio, l'effetto di su può aumentare di magnitudine all'aumentare dei valori di .X1YX2X1X2X1YX2
Il secondo modello può essere ri-espresso in questo modo:
Y=β0+(β1+β3X2)X1+β4X21+β2X2+β5X22+ϵ,
che mostra che, in questo modello, si presume che l'effetto di su (controllando l'effetto di ) sia quadratico anziché lineare. Questo effetto quadratico viene catturato includendo sia che nel modello. Mentre si assume che il coefficiente di sia indipendente da , si presume che il coefficiente di dipenda linearmente da .X1YX2X1X21X21X2X1X2
L'uso di uno dei due modelli implicherebbe che stai facendo ipotesi completamente diverse sulla natura dell'effetto di su (controllando l'effetto di ).X1YX2
Di solito, le persone si adattano al primo modello. Potrebbero quindi tracciare i residui di quel modello contro e a turno. Se i residui rivelano un modello quadratico nei residui in funzione di e / o , il modello può essere aumentato di conseguenza in modo da includere e / o (e possibilmente la loro interazione).X1X2X1X2X21X22
Si noti che ho semplificato la notazione usata per coerenza e reso esplicito il termine di errore in entrambi i modelli.