È valido includere una misura di base come variabile di controllo quando si verifica l'effetto di una variabile indipendente sui punteggi delle modifiche?


38

Sto tentando di eseguire una regressione OLS:

  • DV: variazione di peso nell'arco di un anno (peso iniziale - peso finale)

  • IV: se ti alleni o meno.

Tuttavia, sembra ragionevole che le persone più pesanti perderanno più peso per unità di esercizio rispetto alle persone più magre. Pertanto, volevo includere una variabile di controllo:

  • CV: peso iniziale iniziale.

Tuttavia, ora il peso iniziale viene utilizzato ENTRAMBE per calcolare la variabile dipendente E come variabile di controllo.

Va bene? Ciò viola un'ipotesi di OLS?


4
Il trattamento è stato assegnato in modo casuale?
Andy W,

1
Si noti che recentemente è stato chiesto anche un altro molto simile, stats.stackexchange.com/q/15104/1036 . La risposta a questa domanda è applicabile a questa domanda (in effetti, direi che sono domande duplicate).
Andy W,

3
@Andy In realtà, le due domande sono abbastanza diverse da dare una risposta diversa a questa da quella che ho dato all'altra. Charlie ha già dato una bella analisi qui.
whuber

3
Si noti che l'utilizzo dei punteggi delle differenze è in genere associato a una sostanziale riduzione dell'affidabilità, sebbene ciò sia in qualche modo dibattuto
Behacad,

Risposte:


25

Per rispondere alla tua domanda letterale, "È valido includere una misura di base come variabile di controllo quando si verifica l'effetto di una variabile indipendente sui punteggi delle modifiche?", La risposta è no . La risposta è no, perché per costruzione il punteggio di base è correlato al termine di errore quando il punteggio di variazione viene utilizzato come variabile dipendente, quindi l'effetto stimato della linea di base sul punteggio di modifica non è interpretabile.

utilizzando

  • come peso inizialeY1
  • come peso finaleY2
  • come variazione di peso (ovvero Δ YΔY )ΔY=Y2Y1
  • cometrattamentoassegnato in modo casualeeT
  • come altri fattori esogeni che influenzano il peso (ad esempio altre variabili di controllo correlate al risultato ma che non devono essere correlate al trattamento a causa di assegnazione casuale)X

Uno ha quindi un modello che regredisce ΔY su e X ;TX

ΔY=β1T+β2X+e

Che per definizione equivale a;

Y2Y1=β1T+β2X+e

Ora, se includi la linea di base come covariata, dovresti vedere un problema, in quanto hai il termine su entrambi i lati dell'equazione. Questo dimostra che β 3 YY1 non è interpretabile, poiché èintrinsecamentecorrelato al termine di errore.β3Y1

Y2Y1=β1T+β2X+β3Y1+eY2=β1T+β2X+β3Y1+(e+Y1)

Ora, parte della confusione nelle varie risposte sembra derivare dal fatto che modelli diversi produrranno risultati identici per l' effetto del trattamento , nella mia precedente formulazione. Quindi, se si dovesse confrontare l'effetto del trattamento per il modello usando i punteggi di cambiamento come variabile dipendente rispetto al modello usando i "livelli" (con ogni modello includendo la linea di base Y 1 come covariata), l'interpretazione dell'effetto del trattamento sarebbe lo stesso. Nei due modelli che seguono β 1 T saranno gli stessi, così come le inferenze basate su di essi (Bruce Weaver ha pubblicato un codice SPSS che dimostra anche l'equivalenza).β1TY1β1T

Change Score Model:Y2Y1=β1T+β2X+β3Y1+eLevels Model:Y2=β1T+β2X+β3Y1+e

Quindi alcuni discuteranno (come ha fatto Felix in questa discussione e come ha fatto Bruce Weaver in alcune discussioni sul gruppo google di SPSS) che poiché i modelli producono lo stesso effetto terapeutico stimato, non importa quale si sceglie. Non sono d'accordo, poiché la covariata di base nel modello del punteggio di cambiamento non può essere interpretata, non si dovrebbe mai includere la covariata di base come covariata (indipendentemente dal fatto che l'effetto del trattamento stimato sia lo stesso o meno). Quindi, ciò solleva un'altra domanda: qual è lo scopo nell'utilizzare i punteggi delle modifiche come variabili dipendenti? Come già notato da Felix, il modello che utilizza il punteggio di modifica come variabile dipendente escludendo la linea di base come covariata è diverso dal modello che utilizza i livelli. Per chiarire, i modelli successivi daranno effetti di trattamento diversi (specialmente nel caso in cui il trattamento sia correlato al basale);

Change Score Model Without Baseline:Y2Y1=β1T+β2X+eLevels Model:Y2=β1T+β2X+β3Y1+e

Questo è stato notato nella letteratura precedente come "Lord's Paradox". Quindi quale modello è giusto? Bene, nel caso di esperimenti randomizzati, direi che è preferibile il modello Levels (anche se se hai fatto un buon lavoro randomizzando, l'effetto del trattamento medio dovrebbe essere molto vicino tra i modelli). Altri hanno notato motivi per cui è preferibile il modello dei livelli, la risposta di Charlie sottolinea che è possibile stimare gli effetti di interazione con la linea di base nel modello dei livelli (ma non è possibile nel modello di punteggio delle modifiche). Il whuber in questa risposta a una domanda molto simile dimostra come i punteggi di cambiamento inducano correlazioni tra i diversi trattamenti.

In situazioni in cui il trattamento non è assegnato in modo casuale, il modello che utilizza i punteggi di cambiamento come variabile dipendente dovrebbe essere preso in maggiore considerazione. Il vantaggio principale del modello di punteggio di cambiamento è che ogni volta che vengono controllati predittori invarianti del risultato. Quindi diciamo nella formulazione sopra, è costante nel tempo (per esempio diciamo che una predisposizione genetica è ad un certo peso), e che X è correlata con se un individuo sceglie di esercitare (eXX non sia osservata). In tal caso, è preferibile il modello di punteggio di modifica. Anche nei casi in cui la selezione in trattamento è correlata al valore basale, può essere preferibile il modello di punteggio di cambiamento. Paul Allison nel suo documento,XCambia punteggi come variabili dipendenti nell'analisi di regressione , fornisce questi stessi esempi (e ha influenzato in gran parte la mia prospettiva sull'argomento, quindi consiglio vivamente di leggerlo).

Ciò non significa che i punteggi delle modifiche siano sempre preferibili in impostazioni non casuali. Nel caso in cui si preveda che la linea di base abbia un reale effetto causale sul peso del post, è necessario utilizzare il modello dei livelli. Nel caso in cui si preveda che la linea di base abbia un effetto causale e che la selezione in trattamento sia correlata alla linea di base, l'effetto del trattamento viene confuso con l'effetto di base.

Ho ignorato la nota di Charlie secondo cui il logaritmo del peso poteva essere usato come variabile dipendente. Anche se non dubito che potrebbe essere una possibilità, è in qualche modo non sequitur alla domanda iniziale. Un'altra domanda è stata discussa quando è opportuno utilizzare i logaritmi della variabile (e quelli ancora applicabili in questo caso). Probabilmente esiste una letteratura precedente sull'argomento che potrebbe aiutarti a capire se anche l'uso del peso registrato è appropriato.


Citazione

Allison, Paul D. 1990. Cambia i punteggi come variabili dipendenti nell'analisi di regressione . Metodologia sociologica 20: 93-114. Versione PDF pubblica .


3
Nell'equazione se, come nella pratica standard, assumiamo che tutte le covariate non siano variabili casuali, allora Y 1 non è correlato con e + Y 1 . Quindi penso che ci sia un problema solo se vedi Y 1 come casuale, nel qual caso (di nuovo solo la mia opinione) dovresti modellare ( Y 1 , Y 2 )Y2=β1T+β2X+β3Y1+(e+Y1)Y1e+Y1Y1(Y1,Y2)congiuntamente ma senza come covariata. A questo proposito, senza dati mancanti, sono stato informato che questo approccio equivale a Y 1 essendo una covariata fissa (cercherò di trovare alcuni riferimenti per questo). Y1Y1
Dandar,

1
@dandar, questa affermazione non ha senso per me. Si noti che è il valore di pre-trattamento del risultato , non è la variabile manipolata in un esperimento. Stai dicendo che se ho il valore di base di Y 1 , quindi conduco un esperimento e quindi misuro Y 2 , dovrei modellare sia Y 1 che Y 2 in funzione dell'intervento sperimentale? Y1Y1Y2Y1Y2
Andy W,

1
Il modello di cui sto parlando implica davvero che è una funzione del trattamento, ma solo dal punto di vista del fatto che, nonostante la randomizzazione, ci saranno sempre lievi differenze tra il gruppo di trattamento e di controllo rispetto ai loro mezzi di base. Pertanto β 1 catturerà questa differenza e l'effetto del trattamento. Il riferimento per questo è ("Analisi dei dati longitudinali di risposte continue e discrete per i disegni pre-post" di Zeger e Liang, 2000). Y1β1
Dandar,

1
Una chiara discussione di questo documento può essere trovata in ("La baseline dovrebbe essere una variabile covariata o dipendente nelle analisi del cambiamento rispetto alla baseline negli studi clinici?" Di Liu, Mogg, Mallick e Mehrotra 2009). Si riferiscono a questo modello come a un modello incondizionato (cioè non condiziona sulla risposta di base). Nel documento Liu (2009) discutono i principali risultati del documento Zeger (2000). Questi sono in primo luogo che senza dati mancanti le stime puntuali di dal modello incondizionato sono le stesse dell'approccio condizionale di ANCOVA usando il post-basaleB1
dandar

1
misurazione come risposta e condizionamento su un valore di base fisso, e in secondo luogo che la varianza della stima puntuale dal modello ANCOVA è sempre maggiore o uguale a quella di quella incondizionata. Si scopre che questa differenza di varianza sarà generalmente piccola a causa della randomizzazione assicurando che le risposte medie al basale tra i gruppi siano piccole. Gli autori concludono che il modello incondizionato è appropriato per la modellazione della linea di base come variabile casuale, ma ANCOVA è appropriato quando viene visualizzato come fisso.
Dandar,

21

La risposta di Andy sembra essere la visione economista delle cose. È accettata la pratica negli studi clinici di adeguarsi quasi sempre alla versione di base della variabile di risposta, per aumentare notevolmente la potenza. Poiché condizioniamo le variabili di base, non esiste un "termine di errore" che possa essere confuso con il termine di errore complessivo. L'unico problema sarebbe se gli errori di misurazione nella covariata di base fossero confusi con un'altra X, distorcendo l'effetto di quell'altra X. Il metodo preferito complessivo è regolare la linea di base e modellare la variabile di risposta, senza calcolare il cambiamento. Uno dei motivi è che il cambiamento dipende fortemente dall'ottenere corretta la trasformazione di Y e che il cambiamento non si applica ai modelli di regressione in generale. Ad esempio, se Y è ordinale, la differenza tra due variabili ordinali non è più ordinale.


1
Non capisco pienamente questa risposta. Cosa intendi con "aggiusta per la linea di base"? Fare la differenza o controllarla?
Henrik,

3
Con "aggiustare la linea di base" intendevo includere la linea di base come covariata. È anche comune usare i punteggi delle modifiche, ma non è possibile utilizzarli senza anche aggiustare la linea di base come covariata (quindi perché preoccuparsi dei punteggi delle modifiche?).
Frank Harrell,

6
In realtà nulla di ciò che dici qui (o in risposta ai commenti di Felix) è direttamente in conflitto con ciò che dico. L'uso dei punteggi delle modifiche non "si adegua alla linea di base", controlla in qualsiasi momento le variabili omesse invarianti (o se la selezione nel trattamento è altamente correlata con la linea di base). Se la linea di base non è instabile (ovvero ha un effetto causale diretto sull'esito o ha un'interazione con il trattamento) i punteggi di modifica non risolvono il problema.
Andy W,

2
@Frank Harrell Grazie per aver partecipato a questa discussione e chiarito questo. (+1)
Henrik,

8

Possiamo modificare leggermente il ragionamento di @ ocram per avere

E[w1w0X,w0]=β0+xβ+w0γE[w1X,w0]=β0+xβ+w0(γ+1)

Quindi, se questo è il modello giusto , dire che la differenza dipende dal peso implica che il valore finale dipende dal valore iniziale con un coefficiente che potrebbe essere qualsiasi cosa. Esecuzione di una regressione della differenza da e w 0 o il peso finale sulle stesse variabili dovrebbe darvi gli stessi coefficienti su tutto, ma w 0 . Ma se questo modello non è esattamente corretto, queste regressioni daranno risultati diversi anche sugli altri coefficienti.xw0w0

Si noti che questa impostazione implica che il peso iniziale prevede la differenza di peso, non l' impatto del trattamento . Ciò richiederebbe un termine di interazione, forse

E[w1w0X,w0]=β0+(xw0)β+w0γ.

Un altro approccio sarebbe quello di calcolare qui, r è il tasso di crescita del peso. Questo potrebbe essere il tuo risultato. I tuoi coefficienti su x

log(w1)log(w0)r;
rxti direbbe come questi predittori sono correlati alle variazioni proporzionali del peso. Questo "controlla" il peso iniziale dicendo che, ad esempio, un regime di esercizio che riduce il peso del 10% (un coefficiente di 0,1 moltiplicato per il 100%) per qualcuno che pesa 130 libbre riduce il peso di 13 libbre, mentre il programma riduce il peso di un partecipante di 200 sterline per 20 libbre. In questo caso, potrebbe non essere necessario includere il peso iniziale (o il relativo registro) sul lato destro.

Un termine di interazione può essere ancora necessario se si ritiene che l'impatto del programma dipenda dal peso iniziale. Se si utilizza nel termine di interazione, il programma verrebbe associato a una variazione di w 0 β 1 nel tasso di crescita del peso. Ogni chilo più pesante di una persona all'inizio del programma porta a un β 1w0w0β1β1 aumento di nella variazione del tasso di crescita (questa è la derivata cross-parziale del valore atteso rispetto sia al trattamento che al peso iniziale).

Se si utilizza nel termine di interazione, l'impatto del programma aumenta di β 1 / w 0 per ogni chilo in più che il partecipante era all'inizio del programma.log(w0)β1/w0

Come puoi vedere, i cross-partial in termini di interazione possono diventare un po 'difficili da interpretare, ma possono catturare un impatto che ti interessa.


Ciao Charlie, vedo il vantaggio di usare il cambio di proporzione, tuttavia perché trovi la differenza nelle variabili registrate invece di dividere semplicemente w1 su w0.
ChrisStata,

Mi piace l'idea del cambiamento proporzionale. La domanda rimane tuttavia se l'interazione attesa è letteralmente proporzionale o meno. In caso contrario, dovresti comunque includere il peso iniziale come covariata. O saresti sicuro che sia della stessa difficoltà perdere il 10% del tuo peso per una persona di 100 o 200 sterline ??
Henrik,

@ChrisStata, potresti farlo anche tu. Sono un economista e adoriamo i nostri registri (e anche le differenze). Se avessi una serie temporale (cioè più osservazioni) per ogni persona (creando un set di dati del panel), potrei sostenere che la mia strada è migliore, ma non è rilevante qui. Henrik, hai ragione; Ho aggiunto un po 'di questo alla mia risposta.
Charlie,

8

EDIT: l'argomento di Andy W mi ha convinto a rinunciare al modello C. Ho aggiunto un'altra possibilità: analizzare il cambiamento con modelli a coefficiente casuale (aka modelli multilivello o modelli ad effetto misto

C'è stato molto dibattito scientifico sull'uso dei punteggi delle differenze. I miei testi preferiti sono Rogosa (1982, [1]) e Fitzmaurice, Laird, & Ware (2004, [2])

In generale, hai tre possibilità di analizzare i tuoi dati:

  • A) Prendi solo il punteggio di differenza interindividuale (il punteggio di cambiamento)
  • B) Trattare la misurazione post come DV e controllarla per la linea di base
  • C) Prendi il punteggio differenza come DV e controllalo per la linea di base (questo è il modello che hai suggerito). A causa degli argomenti di Andy W, ho lasciato cadere questa alternativa
  • D) Utilizzando un approccio multilivello / modello a effetti misti, in cui la linea di regressione è modellata per ciascun partecipante e i partecipanti sono trattati come unità di livello 2.

I modelli A e B possono produrre risultati molto diversi se la linea di base è correlata al punteggio di cambiamento (ad esempio, le persone più pesanti hanno più perdita di peso) e / o l'assegnazione del trattamento è correlata alla linea di base.

Se vuoi saperne di più su questi problemi, consulta i documenti citati oppure qui e qui .

C'è stato anche un recente studio di simulazione [3] che confronta empiricamente le condizioni in cui sono preferibili A o B.

Per i progetti completamente bilanciati senza valori mancanti, il modello D dovrebbe essere equivalente al modello A. Tuttavia, offre maggiori informazioni sulla variabilità tra le persone, è facilmente esteso a più punti di misurazione e ha belle proprietà in presenza di dati sbilanciati e / o valori mancanti.

Come linea di fondo: nel tuo caso, analizzerei le post-misure controllate per la linea di base (modello B).

[1] Rogosa, D., Brandt, D., e Zimowski, M. (1982). Un approccio alla curva di crescita per la misurazione del cambiamento. Bollettino psicologico, 92, 726-748.

[2] Fitzmaurice, GM, Laird, NM e Ware, JH (2004). Analisi longitudinale applicata. Hoboken, NJ: Wiley.

[3] Petscher, Y., & Schatschneider, C., 2011. Uno studio di simulazione sulle prestazioni della differenza semplice e dei punteggi adattati alla covarianza in disegni sperimentali randomizzati. Journal of Educational Measurement, 48, 31-43.


Ho ridimensionato questa risposta e puoi vedere la mia risposta al motivo per cui credo che i punteggi di cambiamento con la baseline come covariata non dovrebbero essere fatti. Per riassumere, anche se i modelli B e C nella tua formulazione producono effetti di trattamento equivalenti, ciò non significa che il modello C sia preferibile. In effetti, l'effetto di base nel modello C non è interpretabile, quindi sostengo che non dovrebbe essere usato.
Andy W,

@AndyW: il tuo argomento mi ha convinto; sebbene la stima più rilevante dell'effetto del trattamento sia la stessa in entrambi i modelli, il modello B dovrebbe essere preferito al modello C. Ho adattato la mia risposta di conseguenza. Ma a che cosa dici Laird, N. (1983). Further Comparative Analyses of Pretest-Posttest Research Designs. The American Statistician, 37, 329-330., che mostra un'equivalenza di B e C?
Felix S,

Non credo che nulla di ciò che ho detto sia in conflitto con l'articolo di Laird. Fondamentalmente tutto ciò che la mia rabbia era quello (nella notazione di Laird)B¯è interpretabile, quindi perché segnalarlo (l'equivalenza non era in questione). Laird fa altri commenti su come l'effetto della covariata basale possa essere interpretato come un'ipotesi di se i singoli gruppi di trattamento non cambiano (sebbene sia ancora critico nei suoi confronti). Sentiti libero di contrastare il mio punto con situazioni in cuiB¯è utile (sicuramente non è utile nei modi normali di interpretare i coefficienti di regressione).
Andy W,

Un punto per il modello D. Mi chiedo perché non considerare solo il modello D. È il più coerente (il valore di base è una variabile casuale e non è stato forzato a una variabile dipendente), è semplice, molto flessibile (l'interazione può essere aggiunto) e fornisce anche la deviazione standard della popolazione.
giordano,


3

Glymour et al. (2005) affrontato usando l'adeguamento di base durante l'analisi di un punteggio di cambiamento. Se il cambiamento dello stato di salute ha preceduto la valutazione della baseline o c'è un grosso errore di misurazione nella variabile dipendente, scoprono che può sorgere una distorsione se il modello di regressione che usa il punteggio di cambiamento come variabile dipendente include una covariata al basale. La risposta di Frank Harrell "L'unico problema sarebbe se gli errori di misurazione nella covariata di base fossero confusi con un'altra X, distorcendo l'effetto dell'altra X". potrebbe riflettere lo stesso pregiudizio degli indirizzi Glymour.

Glymour (2005) "Quando l'aggiustamento della linea di base è utile nell'analisi del cambiamento? Un esempio di educazione e cambiamento cognitivo. American Journal of Epidemiology 162: 267-278


1

Ocram non è corretto. La differenza di pesi non tiene conto del peso iniziale. In particolare, il peso iniziale viene in qualche modo eliminato sottraendo il peso finale da esso.

Pertanto, direi che non viola alcuna ipotesi se controlli il peso iniziale.

(La stessa logica si applica se si prende la differenza dell'IMC e dell'IMC iniziale.)


Aggiornamento
Dopo che il critico di Andy W mi ha permesso di essere più formale sul perché ho ragione e su Ocram (almeno dal mio punto di vista).

C'è un livello assoluto di peso che ogni persona ha (ad esempio, circa 100 libbre contro 200 libbre). Permettereun'wsia questo peso assoluto.
Quindi, il peso iniziale può essere formalizzato comeiow=un'w e il peso finale come ew=un'w+Δw

Il DV che l'OP vuole usare è quindi Δw=iow-ew=un'w-un'w+Δw=Δw

In altre parole, il livello assoluto di peso (formalizzato come un'w) esce dall'equazione che rappresenta il dv e, quindi, non lo contamina (che non è d'accordo con l'affermazione di Andy W).

Se si desidera tenerne conto, è necessario incorporarlo nel modello separatamente (come parametro ordinario e / o come termine di interazione).

Ovviamente si applica questa stessa logica ΔBMJ e può essere facilmente adattato a proporzioni in cui si direbbe ad esempio: ew=un'w*propΔw


Quando ho detto che la differenza tiene conto del peso iniziale, questo è ciò che intendevo realmente. Ora, nello specifico, cosa vorresti scrivere? peso finale - peso iniziale = ...?
Ocram,

Come ho scritto, la tua argomentazione mi sembra falsa. Direi che in realtà il peso finale prende il peso iniziale più in considerazione come è sulla stessa "scale", mentre il diffeence è "ridimensionata" (come il peso finale, quindi alcuni assoluto valore viene sottratto dal anoher absoulte valore.
Henrik,

(-1) Questo non è corretto. In generale, non dovresti includere la stessa variabile sia sul lato destro che sul lato sinistro dell'equazione (poiché risulta che la variabile indipendente è correlata al termine di errore). Pertanto, se si utilizzano le differenze per la variabile dipendente, non è necessario includere la linea di base come covariata.
Andy W,

@Andy W: So che la tua tesi è in principio corretta. Ma la mia argomentazione è che in qualche modo si parziale il valore assoluto (sottraendo il valore finale con la linea di base) eliminando così questa correlazione. Quindi, aggiungendolo come una covariata non si introduce quel tipo di correlazione spuria dell'errore.
Henrik,

@Henrik, see my response to this question, and why I still believe this sentiment is misguided.
Andy W

0

Observe that

peso finale-peso inizialeY=β0+βTX

è equivalente a

peso finale=peso iniziale+β0+βTX

In parole, l'uso della variazione di peso (anziché il peso finale stesso) in quanto DV rappresenta già il peso iniziale.


1
Ma immagino che ci potrebbe essere un'interazione tra il peso iniziale e la perdita di peso dato l'allenamento. Diciamo che un adulto di 1,90 m di altezza e 70 kg di massa corporea e un adulto di 1,60 m di altezza e 90 kg di massa corporea prendono parte agli stessi esercizi di allenamento. Scommetto che quest'ultimo perde più peso. Ripensandoci: forse l'indice di massa corporea è un CV migliore del solo peso.
xmjx,

1
@xmjx: se pensi che il peso iniziale avrà un impatto sul peso finale - e probabilmente hai ragione - allora è una buona idea introdurlo come offset nel modello come viene fatto qui ...
ocram

3
Non corretto in generale. Se la pendenza del peso di base non è 1,0, l'analisi del cambiamento non sarà equivalente all'analisi del peso finale a meno che il peso iniziale non sia in entrambi i modelli e non si stia utilizzando la regressione ordinaria. Se il peso di base è in due punti, il modello è in realtà più difficile da spiegare, quindi le ragioni per persistere con questo approccio non sono chiare.
Frank Harrell,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.