come interpretare il termine di interazione in formula lm in R?


9

In R, se chiamo la lm()funzione nel modo seguente:

lm.1 = lm(response ~ var1 + var2 + var1 * var2)
summary(lm.1)

Questo mi dà un modello lineare della variabile di risposta con var1, var2e l'interazione tra loro. Tuttavia, come interpretiamo esattamente il termine di interazione?

La documentazione dice che questa è la "croce" tra var1e var2, ma non ha dato una spiegazione di cosa sia esattamente la "croce".

Sarebbe utile per me sapere quali numeri esatti R sta calcolando per incorporare l'interazione tra le due variabili.


Vorresti sapere in modo specifico come R crea la matrice di progettazione per questa formula o sei più interessato a come interpretare un termine così moltiplicativo ("interazione") in termini di modello adattato?
Momo,

Sono più interessato a come interpretare questo termine moltiplicativo. Ad esempio, se voglio scrivere una formula lineare (una matematica, non una R ...), cosa dovrei inserire per il termine moltiplicativo?
Enzo,

Per spiegare cosa significa croce, dai un'occhiata al calcolo e var3 <- var 1 * var2poi alla costruzionelm.2 <- lm(response ~ var1 + var2 + var3)
James Stanley,

1
quindi è semplicemente una moltiplicazione entry-saggia?
Enzo,

1
@Enzo, sì, la croce è letteralmente moltiplicata per i due termini - l'interpretazione dipenderà in gran parte dal fatto var1che var2siano entrambi continui (abbastanza difficile da interpretare, secondo me) o se uno di questi è ad esempio binario categorico (più facile da considerare.) Vedi questa risposta per alcuni esempi di interpretazione di Peter Flom: stats.stackexchange.com/a/45512/16974
James Stanley

Risposte:


8

Il modo standard per scrivere l'equazione di previsione per il tuo modello è:

y^=B0+B1*X1+B2*X2+B12*X1*X2

Ma comprendere l'interazione è un po 'più semplice se consideriamo questo in modo diverso:

y^=(B0+B2*X2)+(B1+B12*X2)*X1

Con questo factoring possiamo vedere che per un dato valore di l'intercetta y per è e la pendenza su è . Quindi la relazione tra e dipende da .X2X1B0+B2*X2X1(B1+B12*X2)yX1X2

Un altro modo per comprenderlo è tracciare le linee previste tra e per valori diversi di (o viceversa). Le funzioni e nel pacchetto TeachingDemos per R sono state progettate per aiutare con questi tipi di grafici.yX1X2Predict.PlotTkPredict


3

Supponiamo di ottenere stime dei punti di 4 per , 2 per e 1,5 per l'interazione. Quindi, l'equazione sta dicendo che la misura èX1X2lm

y=4X1+2X2+1.5X1X2

È quello che volevi?


3

È più facile pensare alle interazioni in termini di variabili discrete. Forse avresti studiato ANOVA a due vie, in cui abbiamo due variabili di raggruppamento (ad esempio sesso e categoria di età, con tre livelli per età) e stiamo osservando come si riferiscono a una misura continua (la nostra variabile dipendente, ad esempio QI).

Il termine x1 * x2, se significativo, può essere compreso (in questo banale esempio inventato) come QI che si comporta in modo diverso attraverso i livelli di età per i diversi sessi. Ad esempio, forse il QI è stabile per i maschi di tutte e tre le fasce d'età, ma le giovani femmine iniziano al di sotto dei giovani maschi e hanno una traiettoria verso l'alto (con la fascia di età avanzata che ha una media più alta rispetto alla fascia di età avanzata per i maschi). In un diagramma dei mezzi, ciò implicherebbe una linea orizzontale per i maschi nel mezzo del grafico e forse una linea di 45 gradi per le femmine che inizia sotto i maschi ma finisce sopra i maschi.

L'essenza è che mentre ti muovi lungo i livelli di una variabile (o "mantenendo costante X1"), ciò che sta succedendo nell'altra variabile cambia. Questa interpretazione funziona anche con variabili predittive continue, ma non è così facile da illustrare concretamente. In tal caso, potresti voler prendere valori particolari di X1 e X2 e vedere cosa succede a Y.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.