Regressione moderata: perché calcoliamo un termine * prodotto * tra i predittori?


12

Le analisi di regressione moderate sono spesso utilizzate nelle scienze sociali per valutare l'interazione tra due o più predittori / covariate.

In genere, con due variabili predittive, viene applicato il seguente modello:

Y=β0+β1X+β2M+β3XM+e

Si noti che il test di moderazione è reso operativo dal termine prodotto XM (la moltiplicazione tra la variabile indipendente X e la variabile moderatore M ). La mia domanda fondamentale è: perché calcoliamo effettivamente un termine del prodotto tra X e M ? Perché non, ad esempio, la differenza assoluta |MX|o solo la somma X+M ?

È interessante notare che Kenny allude a questo problema qui http://davidakenny.net/cm/moderation.htm dicendo: "Come si vedrà, il test di moderazione non è sempre reso operativo dal termine prodotto XM", ma non vengono fornite ulteriori spiegazioni . Un'illustrazione o una prova formale sarebbe illuminante, immagino / spero.

Risposte:


12

Un "moderatore" influenza i coefficienti di regressione di rispetto a : potrebbero cambiare con il variare dei valori del moderatore. Quindi, in generale, il semplice modello di moderazione della regressione èXYX

E(Y)=α(M)+β(M)X

dove e sono funzioni del moderatore anziché costanti affetti da valori di .β M MαβMM

Nello stesso spirito in cui la regressione si basa su un'approssimazione lineare della relazione tra e , possiamo sperare che sia che siano - almeno approssimativamente - funzioni lineari di tutta la gamma di valori di nei dati:Y α β M MXYαβMM

E(Y)=α0+α1M+O(M2)+(β0+β1M+O(M2))X=α0+β0X+α1M+β1MX+O(M2)+O(M2)X.

Eliminare i termini non lineari ("big-O"), nella speranza che siano troppo piccoli per importare, fornisce il modello di interazione moltiplicativa (bilineare)

(1)E(Y)=α0+β0X+α1M+β1MX.

Questa derivazione suggerisce un'interpretazione interessante dei coefficienti: è la velocità con cui cambia l' intercetta mentre è la velocità con cui cambia la pendenza . ( e sono la pendenza e l'intercettazione quando è (formalmente) impostato su zero.) è il coefficiente del "termine prodotto" . Risponde alla domanda in questo modo: M βα1M M α 0 β 0 M β 1 M Xβ1Mα0β0Mβ1MX

Modelliamo la moderazione con un termine di prodotto quando ci aspettiamo che il moderatore sarà (circa, in media) hanno una relazione lineare con la pendenza della vs .M Y XMXMY X


È interessante notare che questa derivazione indica la strada verso un'estensione naturale del modello, che potrebbe suggerire modi per verificare la bontà dell'adattamento. Se non ti preoccupi della non linearità in - conosci o presumi che il modello sia accurato - allora vorresti estendere il modello per adattarlo ai termini che sono stati rilasciati:( 1 )X(1)

E(Y)=α0+β0X+α1M+β1MX+α2M2+β2M2X.

Testare l'ipotesi valuta la bontà . Stimare e potrebbe indicare in che modo potrebbe essere necessario estendere il modello : per incorporare la non linearità in (quando ) o una relazione di moderazione più complicata (quando ) o possibilmente tutti e due. (Si noti che questo test non sarebbe suggerito da un'espansione in serie di potenze di una funzione generica .)α 2 β 2 ( 1 )α2=β2=0α2β2(1)α 20 β 20 f ( X , M )Mα20β20f(X,M)


Infine, se dovessi scoprire che il coefficiente di interazione non era significativamente diverso da zero, ma che l'adattamento non è lineare (come evidenziato da un valore significativo di ), allora concluderesti (a) c'è moderazione ma ( b) non è modellato da un termine , ma da alcuni termini di ordine superiore che iniziano con . Questo potrebbe essere il tipo di fenomeno a cui si riferiva Kenny.β 2 M X M 2 Xβ1β2MXM2X


8

Se usi la somma dei predittori per modellare la loro interazione, la tua equazione sarebbe:

Y=β0+β1X+β2M+β3(X+M)+e=β0+β1X+β2M+β3X+β3M+e=β0+(β1+β3)X+(β2+β3)M+e=β0+β1X+β2M+e

dove e . Pertanto, il tuo modello non avrebbe alcuna interazione. Chiaramente, questo non è il caso del prodotto.β1=β1+β3β2=β2+β3

Richiama la definizione del valore assoluto:

|XM|={XM,XMMX,X<M

Sebbene sia possibile ridurre il modello a quello con solo e termini, usando il def. di, il valore assoluto è una "forma specializzata di moderazione che è improbabile che sia realistica in molte situazioni", come sottolineato nel commento qui sotto.X M | X - M |β0+β1X+β2M+β3|XM|+eXM|XM|


1
In realtà, incluso unil termine è una forma di moderazione: il valore di cambia . È, tuttavia, una forma limitata e specializzata di moderazione che difficilmente sarà realistica in molte situazioni. Non è corretto affermare che un tale modello abbia "solo effetti principali". M β 2|XM|Mβ2
whuber

1
Sì, hai ragione,è una forma di moderazione, mi sono lasciato trascinare dalla trasformazione e modificherò la risposta di conseguenza. Grazie per averlo segnalato. |XM|
Milos,

@Milos: il tuo esempio sulla somma dei predittori è stato un colpo d'occhio, un po 'imbarazzante, devo dire perché avrei dovuto già rendermi conto delle implicazioni matematiche;) whuber: per quanto ho capito, il valore assoluto è solo utile quando entrambe le variabili predittive vengono misurate in stesse unità (ad esempio due test psicometrici, utilizzando la stessa metrica, come i punteggi z o i punteggi T). La differenza assoluta tra X e M è una metrica utile , sebbene non l'unica possibile (cioè potrebbe anche essere usato il termine prodcut).
denominatore

6

Non troverai una prova formale per l'utilizzo del moderatore moltiplicativo. Puoi supportare questo approccio con altri mezzi. Ad esempio, guarda l'espansione Taylor-MacLaurin di una funzione :f(X,M)

f(X,M)=f(0,0)+f(0,0)TT+f(0,0)MM+2f(0,0)TMTM+2f(0,0)2T2T2+2f(0,0)2M2M2

Se si collega una funzione di questo modulo nell'equazione di Taylor, si ottiene questo:f(X,M)=β0+βXX+βMM+βXMXM

f(X,M)=β0+βXX+βMM+βXMXM

Quindi, la logica qui è che questa particolare forma moltiplicativa della moderazione è sostanzialmente un'approssimazione di Taylor del secondo ordine di una relazione di moderazione genericaf(X,M)

AGGIORNAMENTO: se includi termini quadratici, come suggerito da @whuber, ciò accadrà: a Taylor:

g(X,M)=b0+bXX+bMM+bXMXM+bX2X2+bM2M2
g(X,M)=b0+bXX+bMM+bXMXM+bX2X2+bM2M2

Ciò dimostra che il nostro nuovo modello con termini quadratici corrisponde a un'approssimazione completa di Taylor del secondo ordine, a differenza del modello di moderazione originale .f ( X , M )g(X,M)f(X,M)


Poiché la base del tuo argomento è l'espansione di Taylor, perché non hai incluso anche gli altri due termini quadratici e ? È vero, non sono forme di moderazione, ma la loro inclusione nel modello di solito influirà su . M 2 β X MX2M2βXM
whuber

@whuber, ho deciso di mantenere il post breve - questa è la ragione principale. Altrimenti, ho iniziato a scrivere sulla mia preferenza di includere termini del secondo ordine ogni volta che hai un termine incrociato, quindi ritagliarlo.
Aksakal,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.