Conosciamo tutti gli studi osservazionali che tentano di stabilire un legame causale tra un predittore non randomizzato X e un risultato includendo ogni potenziale confondente immaginabile in un modello di regressione multipla. Così "controllando" tutti i confonditori, sostiene l'argomento, isoliamo l'effetto del predittore di interesse.
Sto sviluppando un crescente disagio con questa idea, basata principalmente su osservazioni fuori mano fatte da vari professori delle mie lezioni di statistica. Cadono in alcune categorie principali:
1. Puoi controllare solo le covariate che pensi e misuri.
Questo è ovvio, ma mi chiedo se sia effettivamente il più pernicioso e insormontabile di tutti.
2. L'approccio ha portato a brutti errori in passato.
Ad esempio, Petitti & Freedman (2005) discutono di come decenni di studi osservazionali statisticamente adeguati siano giunti a conclusioni disastrosamente errate sugli effetti della terapia ormonale sostitutiva sul rischio di malattie cardiache. Gli RCT successivi hanno riscontrato effetti quasi opposti.
3. La relazione predittore-risultato può comportarsi in modo strano quando controlli le covariate.
Yu-Kang Tu, Gunnell e Gilthorpe (2008) discutono di diverse manifestazioni, tra cui il paradosso di Lord, il paradosso di Simpson e le variabili soppressori.
4. È difficile per un singolo modello (regressione multipla) adattarsi adeguatamente alle covariate e modellare contemporaneamente la relazione predittore-risultato.
Ho sentito questo dato come una ragione per la superiorità di metodi come i punteggi di propensione e la stratificazione sui confondenti, ma non sono sicuro di capirlo davvero.
5. Il modello ANCOVA richiede che la covariata e il predittore di interesse siano indipendenti.
Ovviamente, ci adeguiamo ai confonditori proprio perché PERICOLI sono correlati con il predittore di interesse, quindi, a quanto pare, il modello non avrà esito positivo nei casi esatti in cui lo desideriamo di più. L'argomento sostiene che l'adattamento è appropriato solo per la riduzione del rumore negli studi randomizzati. Miller & Chapman, 2001 danno un'ottima recensione.
Quindi le mie domande sono:
- Quanto sono gravi questi problemi e altri che potrei non conoscere?
- Quanto dovrei avere paura quando vedo uno studio che "controlla tutto"?
(Spero che questa domanda non si stia avventurando troppo nel territorio della discussione e che inviti felicemente qualche suggerimento per migliorarla.)
EDIT : ho aggiunto il punto 5 dopo aver trovato un nuovo riferimento.