Assegnazione casuale: perché preoccuparsi?


9

L'assegnazione casuale è preziosa perché garantisce l'indipendenza del trattamento da potenziali esiti. Questo è il modo in cui conduce a stime imparziali dell'effetto medio del trattamento. Ma altri schemi di assegnazione possono anche garantire sistematicamente l'indipendenza del trattamento da potenziali esiti. Quindi perché abbiamo bisogno di un incarico casuale? Detto in altro modo, qual è il vantaggio dell'assegnazione casuale rispetto agli schemi di assegnazione non casuale che portano anche a un'inferenza imparziale?

Sia un vettore di incarichi di trattamento in cui ogni elemento è 0 (unità non assegnata al trattamento) o 1 (unità assegnata al trattamento). In un articolo JASA , Angrist, Imbens e Rubin (1996, 446-47) affermano che l'assegnazione del trattamento è casuale se per tutti \ mathbf {c} e \ mathbf {c'} tali che \ iota ^ T \ mathbf {c} = \ iota ^ T \ mathbf {c '} , dove \ iota è un vettore di colonna con tutti gli elementi uguali a 1.ZZiPr(Z=c)=Pr(Z=c)ccιTc=ιTcι

In parole, l'affermazione è che l'incarico Zi è casuale se un vettore di incarichi che include m incarichi al trattamento è probabile come qualsiasi altro vettore che include m incarichi al trattamento.

Ma, per garantire l'indipendenza dei potenziali risultati dall'assegnazione del trattamento, è sufficiente garantire che ogni unità nello studio abbia pari probabilità di assegnazione al trattamento. E ciò può accadere facilmente anche se la maggior parte dei vettori di assegnazione del trattamento ha zero probabilità di essere selezionata. Cioè, può accadere anche in caso di assegnazione non casuale.

Ecco un esempio Vogliamo eseguire un esperimento con quattro unità in cui vengono trattate esattamente due. Esistono sei vettori di assegnazione possibili:

  1. 1100
  2. 1010
  3. 1001
  4. 0110
  5. 0101
  6. 0011

dove la prima cifra in ciascun numero indica se la prima unità è stata trattata, la seconda cifra indica se la seconda unità è stata trattata e così via.

Supponiamo di eseguire un esperimento in cui escludiamo la possibilità di assegnare i vettori 3 e 4, ma in cui ciascuno degli altri vettori ha pari (25%) possibilità di essere scelto. Questo schema non è un'assegnazione casuale in senso AIR. Ma in previsione, porta a una stima imparziale dell'effetto medio del trattamento. E questo non è un caso. Qualsiasi schema di assegnazione che dia ai soggetti pari probabilità di assegnazione al trattamento consentirà una stima imparziale dell'ATE.

Quindi: perché abbiamo bisogno di assegnazioni casuali in senso AIR? La mia argomentazione è radicata nell'inferenza di randomizzazione; se si pensa invece in termini di inferenza basata sul modello, la definizione di AIR sembra più difendibile?


3
Non ho letto Angrist et al., Quindi forse mi manca qualcosa, ma ho un cavillo con il tuo fraseggio. Non utilizziamo assegnazioni casuali per assicurare che il trattamento sia indipendente dai potenziali esiti. Se il trattamento è indipendente dai risultati in un vero esperimento dipende dal fatto che esista una connessione causale diretta tra il trattamento e il risultato. Piuttosto, un'assegnazione casuale assicura che il trattamento sia indipendente da variabili in agguato (o potenziali fattori di confondimento). È la possibilità che il risultato sia stato causato da qualcosa di diverso dal trattamento che speriamo di escludere.
gung - Ripristina Monica

1
@gung, penso che stai unendo "esiti potenziali" e "esiti". È vero che l'assegnazione casuale non garantisce l'indipendenza del trattamento dagli esiti (cioè dagli esiti osservati). Ma i risultati potenziali non sono gli stessi dei risultati osservati e l'assegnazione casuale garantisce l'indipendenza del trattamento dai risultati potenziali. Non modificherò il post originale per espandere su questo punto; farlo mi porterebbe troppo lontano dall'argomento principale. Ma en.wikipedia.org/wiki/Rubin_causal_model può essere utile su questo punto.
user697473,

3
"[T] o garantire l'indipendenza dei potenziali risultati dall'assegnazione del trattamento, è sufficiente garantire che ogni unità nello studio abbia pari probabilità di assegnazione al trattamento." Questo non è corretto Supponiamo di aver arruolato maschi e femmine in uno studio. Lancia una moneta giusta: se esce testa, assegna tutte le femmine al gruppo di trattamento (e tutti i maschi al gruppo di controllo); se esce croce, tutti i maschi saranno nel gruppo di trattamento e tutte le femmine nel gruppo di controllo. Ogni soggetto (ovviamente) ha il 50% di possibilità di assegnazione al gruppo di trattamento, ma il trattamento è completamente confuso con il genere. xx
whuber

1
@whuber, il tuo commento non sembra corretto. Per capire perché, supponiamo = 1. I potenziali esiti dell'uomo sono Y (1) = 1 e Y (0) = 0. (Cioè, = 1 se l'uomo è trattato, 0 se no.) Per la donna, i risultati potenziali sono Y (1) = -1 e Y (0) = 2. (I risultati potenziali particolari non contano molto, ma i piccoli numeri interi mantengono le cose semplici.) Quindi E [Y (1) | Z] = E [Y (1)] = 0. Equivalenze simili valgono per E [Y (0)]. Più in generale, il meccanismo di assegnazione non è confuso con il genere e produrrà una stima ATE imparziale. Se sto fraintendendo qualcosa, per favore fatemi sapere. xYm
user697473,

3
Certo, la stima è "imparziale" nello stesso senso in cui un orologio fermo fornisce una stima imparziale del tempo! In realtà, è peggio di così: questo metodo di selezione casuale produce risultati che non possono essere attribuiti al trattamento, perché possono anche essere attribuiti al genere. Questo è ciò che significa confondere. Concentrarsi sull'ottenere risultati imparziali mentre si distruggono tutte le informazioni utili nell'esperimento è il proverbiale lancio del bambino ...
whuber

Risposte:


8

Questo fa seguito al commento di Gung. L'effetto terapeutico medio complessivo non è il punto.

Supponiamo di avere nuovi casi di diabete in cui il soggetto ha un'età compresa tra e e nuovi pazienti con diabete di età superiore ai . Vuoi assegnare la metà al trattamento. Perché non lanciare una moneta, e sulla testa, trattare tutti i giovani pazienti, e su code, trattare tutti i pazienti più anziani? Ognuno avrebbe un100051510003050%possibilità di essere selezionato per il trattamento, quindi ciò non pregiudicherebbe il risultato medio del trattamento, ma eliminerebbe molte informazioni. Non sarebbe una sorpresa se il diabete giovanile o i pazienti più giovani risultassero molto meglio o peggio dei pazienti più anziani con diabete di tipo II o gestazionale. L'effetto del trattamento osservato potrebbe essere imparziale ma, ad esempio, avrebbe una deviazione standard molto più grande di quella che si verificherebbe con un'assegnazione casuale e, nonostante il grande campione, non si sarebbe in grado di dire molto. Se usi un incarico casuale, allora con alta probabilità circa casi in ogni fascia d'età otterrebbero il trattamento, quindi sarai in grado di confrontare il trattamento senza alcun trattamento all'interno di ogni fascia d'età. 500

Potresti essere in grado di fare meglio che utilizzare un incarico casuale. Se noti un fattore che ritieni possa influenzare la risposta al trattamento, potresti voler assicurarti che i soggetti con quell'attributo siano suddivisi in modo più uniforme di quanto accadrebbe con un incarico casuale. L'assegnazione casuale ti consente di fare ragionevolmente bene con tutti i fattori contemporaneamente, in modo da poter successivamente analizzare molti possibili schemi.


Grazie Douglas. Questa risposta ha senso per me. Per la cronaca, non avevo in mente nulla di estremo come il tuo esempio o l'esempio di @ whuber sopra. Stavo pensando invece ai casi in cui eliminiamo dalla considerazione solo alcuni vettori di trattamento. (Considera un caso in cui un cliente dice "puoi trattare questa persona o quella, ma non entrambe.") Ma penso che i tuoi punti generali valgano anche per i casi più lievi che ho in mente.
user697473,

Penso che se elimini solo pochi vettori, allora non cambi la quantità di informazioni che puoi estrarre di molto. Quantificare accuratamente questo può essere disordinato - ci sono limiti ingenui che sono probabilmente troppo pessimisti.
Douglas Zare,

@DouglasZare Ho una domanda sul tuo esempio estremo. Credo che l'obiettivo sia scoprire se il trattamento è efficace per la popolazione che ha sia pazienti giovani che anziani. Quindi, il tuo metodo genererà due campioni che non possono essere considerati come campioni rappresentativi dalla potenziale distribuzione dove tutte le persone prendono il trattamento e la potenziale distribuzione dove tutte le persone prendono il controllo. Quindi l'effetto del trattamento osservato è parzialeFtFc
KevinKim

1

Nel tuo esempio puoi lasciare fuori anche 2 e 5 e non contraddirti. A livello di oggetto c'è ancora la stessa possibilità di essere 1 o 0 quando ci sono solo 1: 1 probabilità di selezionare 1 o 6. Ma ora ciò che hai fatto rimuovendo 3 e 4 diventa più ovvio.


Grazie John. Sì hai ragione. Sembra che possiamo eliminare tutti i vettori di assegnazione del trattamento che vogliamo, in qualsiasi combinazione, purché utilizziamo i vettori rimanenti in un modo che dia ad ogni unità la stessa probabilità di assegnazione al trattamento.
user697473,

Non penso che tu stia ottenendo quello che sto dicendo. Quello che ho presentato è il caso ad absurdum per la tua argomentazione che la contesta.
John,

Il tuo esempio è estremo, ma non vedo nulla di assurdo al riguardo. È una dimostrazione valida del punto: gli schemi di assegnazione non casuali (come l'uso solo dei vettori 1 e 6) possono portare direttamente a una stima imparziale dell'effetto medio del trattamento. Ne consegue che non abbiamo bisogno di assegnazioni casuali per ottenere stime ATE imparziali. Naturalmente, potrebbero esserci ancora dei motivi per cui è male eliminare i vettori da 2 a 5. (Vedi il commento di Douglas Zare sopra ). Non ho ancora riflettuto su questi motivi.
user697473,

Dovresti. È per questo che non puoi eliminarli.
Giovanni,

1

Ecco un'altra delle variabili in agguato o confondenti: tempo (o deriva strumentale, effetti della memorizzazione del campione, ecc.).
Quindi ci sono argomenti contro la randomizzazione (come dice Douglas: potresti fare meglio della randomizzazione). Ad esempio puoi sapere in anticipo che vuoi che i tuoi casi siano bilanciati nel tempo. Proprio come puoi sapere in anticipo che vuoi avere un equilibrio tra genere ed età.

In altre parole, se vuoi scegliere manualmente uno dei tuoi 6 schemi, direi che 1100 (o 0011) è una scelta decisamente sbagliata . Nota che le prime possibilità che hai gettato sono quelle più equilibrate nel tempo ... E le peggiori due sono rimaste dopo che John ha proposto di buttar via anche 2 e 5 (contro i quali non hai protestato).
In altre parole, la tua intuizione su quali schemi sono "belli" sfortunatamente porta a una cattiva progettazione sperimentale (IMHO questo è abbastanza comune; forse le cose ordinate sembrano più belle - e sicuramente è più facile tenere traccia delle sequenze logiche durante l'esperimento).

Potresti essere in grado di fare meglio con schemi non randomizzati, ma puoi anche fare molto peggio. IMHO, dovresti essere in grado di fornire argomenti fisici / chimici / biologici / medici / ... per il particolare schema non casuale che usi, se scegli uno schema non casuale.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.