Cosa significa "tutto il resto uguale" nella regressione multipla?


22

Quando facciamo regressioni multiple e diciamo che stiamo osservando la variazione media nella variabile per una variazione in una variabile , mantenendo costanti tutte le altre variabili, a quali valori manteniamo costanti le altre variabili? La loro media? Zero? Qualche valore?xyX

Sono propenso a pensare che abbia valore; sto solo cercando chiarimenti. Se qualcuno avesse una prova, sarebbe fantastico.


2
Ho trovato l'esempio 10 nel documento di Peter Kennedy molto utile per capire questo.
Dimitriy V. Masterov,

Sì, la parte relativa all'aumento del numero di stanze mantenendo costanti i piedi quadrati è un punto davvero osservativo. Quel documento è in realtà una miniera d'oro di idee utili, sta andando nelle note di dottorato.
EconStats,

1
Questa è in realtà una domanda molto interessante, mi chiedo se gli economisti si chiedano cosa significhi esattamente "ceteris paribus".
Mugen,

Risposte:


26

Hai ragione. Tecnicamente, ha valore . Tuttavia, quando insegno questo, di solito dico alle persone che stai ottenendo l'effetto di un cambio di un'unità in quando tutte le altre variabili sono mantenute nei loro rispettivi mezzi. Credo che questo sia un modo comune per spiegarlo che non è specifico per me. Xj

Di solito continuo a menzionare che se non si hanno interazioni, sarà l'effetto di una modifica di un'unità in , indipendentemente dai valori delle altre variabili. Ma mi piace iniziare con la formulazione media. Il motivo è che ci sono due effetti dell'inclusione di più variabili in un modello di regressione. Innanzitutto, ottieni l'effetto del controllo di per le altre variabili (vedi la mia risposta qui ). Il secondo è che la presenza delle altre variabili (in genere) riduce la varianza residua del modello, rendendo le variabili (inclusoX j X j X j XβjXjXjXj) "più significativo". È difficile per le persone capire come funziona se le altre variabili hanno valori ovunque. Sembra che aumenterebbe la variabilità in qualche modo. Se si pensa di regolare ciascun punto dati verso l'alto o verso il basso per il valore di ogni altra variabile fino a quando tutte le restanti variabili sono state spostate nei rispettivi mezzi, è più facile vedere che la variabilità residua è stata ridotta. X

Non riesco ad interagire fino a quando una classe o due dopo aver introdotto le basi della regressione multipla. Tuttavia, quando arrivo a loro, torno a questo materiale. Quanto sopra si applica quando non ci sono interazioni. Quando ci sono interazioni, è più complicato. In tal caso, la variabile interagente [s] viene mantenuta costante (in modo molto specifico) a e nessun altro valore. 0

Se vuoi vedere come funziona algebricamente, è piuttosto semplice. Possiamo iniziare con il caso di non interazione. Determiniamo il cambiamento in quando tutte le altre variabili sono mantenute costanti ai rispettivi mezzi. Senza perdita di generalità, diciamo che ci sono tre variabili e siamo interessati a capire come il cambiamento in è associato a un cambiamento di un'unità in , mantenendo e costanti nei rispettivi mezzi: X Y X3X1X2Y^XY^X3X1X2

Y^io=β^0+β^1X¯1+β^2X¯2+β^3X3ioY^io'=β^0+β^1X¯1+β^2X¯2+β^3(X3io+1) sottraendo la prima equazione dalla seconda: Y^io'-Y^io=β^0-β^0+β^1X¯1-β^1X¯1+β^2X¯2-β^2X¯2+β^3(X3io+1)-β^3X3ioΔY=β^3X3io+β^3-β^3X3ioΔY=β^3

Ora è ovvio che avremmo potuto inserire qualsiasi valore per e nelle prime due equazioni, purché in entrambi abbiamo inserito lo stesso valore per ( ). Cioè, finché e costanti . X 2 X 1 X 2 X 1 X 2X1X2X1X2X1X2

D'altra parte, non funziona in questo modo se hai un'interazione. Qui mostro il caso in cui esiste un termine di interazione : X1X3

Y^io=β^0+β^1X¯1+β^2X¯2+β^3X3io +β^4X¯1X3ioY^io'=β^0+β^1X¯1+β^2X¯2+β^3(X3io+1)+β^4X¯1(X3io+1) sottraendo la prima equazione dalla seconda: Y^io'-Y^io=β^0-β^0+β^1X¯1-β^1X¯1+β^2X¯2-β^2X¯2+β^3(X3io+1)-β^3X3io+ β^4X¯1(X3io+1)-β^4X¯1X3ioΔY=β^3X3io+β^3-β^3X3io+β^4X¯1X3io+β^4X¯1-β^4X¯1X3ioΔY=β^3+β^4X¯1

In questo caso, non è possibile mantenere tutte le altre costanti. Poiché il termine di interazione è una funzione di e , non è possibile modificare senza cambiare il termine di interazione. Pertanto, uguale alla modifica in associata a una modifica di un'unità in solo quando la variabile interagente ( ) è mantenuta a invece di (o qualsiasi altro valore tranne ), nel qual caso l'ultimo termine nell'equazione in basso scompare. X 3 X 3 β 3 Y X 3 X 1 0 ˉ X 1 0X1X3X3β^3Y^X3 X10X¯10

In questa discussione, mi sono concentrato sulle interazioni, ma più in generale, il problema è quando c'è una variabile che è una funzione di un'altra tale che non è possibile cambiare il valore del primo senza cambiare il rispettivo valore dell'altra variabile . In tali casi, il significato di diventa più complicato. Ad esempio, se avessi un modello con e , allora è la derivata mantiene tutto il resto uguale e (vedi la mia risposta qui ). Sono possibili anche altre formulazioni ancora più complicate. XjX 2 j β jdYβ^jXjXj2β^j Xj=0dYdXjXj=0


1
Grazie, questa risposta è fantastica su un paio di livelli. In primo luogo risponde al punto principale a cui ero interessato. In secondo luogo, hai previsto quale sarebbe stata la mia domanda di follow-up, perché avrei chiesto come sarebbe cambiato con l'introduzione dei termini di interazione. Grazie anche per la matematica. So che questa domanda è un po 'basilare, ma sento che non puoi mai essere troppo esplicito con questi concetti.
EconStats,

Prego, @EconStats. Non c'è alcun problema con l'inclusione della matematica, a volte rende molto più facile capire cosa sta succedendo.
gung - Ripristina Monica

Bene, devo dire che quando hai sottratto la prima equazione dalla seconda equazione alla fine ha confermato i miei pensieri originali che non importa quali siano i valori di e , purché siano uguali in entrambe le equazioni. Mi sembra così ovvio, ma non avevo mai pensato di calcolare la quel modo prima. Momento di lampadina definito per me. X 3 βX2X3β
EconStats,

Puoi anche prendere la derivata di wrt e ti porterà nello stesso posto, ma questo è più facile per la matematica (essenzialmente l'algebra delle scuole superiori), quindi sarà accessibile a un pubblico più ampio. X jYXj
gung - Ripristina Monica

1
@beetroot, se ti capisco correttamente, lo tieni solo a un livello specificato. (Altrimenti, potresti porlo come una nuova domanda.)
gung - Ripristina Monica

8

La matematica è semplice, basta prendere la differenza tra 2 modelli con una delle variabili x cambiata di 1 e vedrai che non importa quali siano le altre variabili (dato che non ci sono interazioni, polinomi o altri termini complicanti).

Un esempio:

y[1]=B0+B1×X1+B2×X2

y[2]=B0+B1×(X1+1)+B2×X2

y[2]-y[1]=B0-B0+B1×X1-B1×X1+B1×1+B2×X2-B2×X2=B1


6

Credo che ti riferisci alla dipendenza nelle covariate ( ). Quindi se il modello è l'effetto di su parità di tutte le altre cose sarebbe per qualsiasi con tutti gli altri mantenuti costanti a qualsiasi valore.Xio

Y=β0+β1X1+β2X2
XioYΔYΔXioΔXioXj

Tieni presente che è possibile che e siano dipendenti (ad es. Funzioni reciproche) senza mostrare necessariamente un'interazione significativa nel modello lineare ( in ).X1X2β12=0Y=β0+β1X1+β2X2+β12X1X2

Proprio come una tangente interessante qui è un esempio: lascia e quindi chiaramente qualsiasi cambiamento in influirà su . Tuttavia, la covarianza tra i due è zero. X1~N(0,σ12)X2=X12+N(0,σ22)X1X2

cov(X1,X2)=E(X1X2)-E(X1)E(X2)
=E[X1(X12+a)]E(X1).E(X12a)withaN(0,σ22)
=E(X13)E(X1.a)0.E(X12a)=000=0

Quindi in realtà una modifica in sarebbe associata a una modifica in e che non coprirebbe ciò che realmente accadrebbe se si modifica . Ma verrebbe comunque descritto come l'effetto di su parità di condizioni.X1X2ΔYΔXiX1ΔYΔXiXiY

Ciò è paragonabile alla differenza tra un derivato completo e un derivato parziale (analogo di ) in un'equazione differenziale. ΔYΔXi


Grazie Hans, in realtà stavo cercando di arrivare al punto che il gung ha fatto, ma questo è un buon esempio per quando le due variabili sono dipendenti.
EconStats,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.