L'assegnazione casuale è preziosa perché garantisce l'indipendenza del trattamento da potenziali esiti. Questo è il modo in cui conduce a stime imparziali dell'effetto medio del trattamento. Ma altri schemi di assegnazione possono anche garantire sistematicamente l'indipendenza del trattamento da potenziali esiti. Quindi perché abbiamo bisogno di un incarico casuale? Detto in altro modo, qual è il vantaggio dell'assegnazione casuale rispetto agli schemi di assegnazione non casuale che portano anche a un'inferenza imparziale?
Sia un vettore di incarichi di trattamento in cui ogni elemento è 0 (unità non assegnata al trattamento) o 1 (unità assegnata al trattamento). In un articolo JASA , Angrist, Imbens e Rubin (1996, 446-47) affermano che l'assegnazione del trattamento è casuale se per tutti \ mathbf {c} e \ mathbf {c'} tali che \ iota ^ T \ mathbf {c} = \ iota ^ T \ mathbf {c '} , dove \ iota è un vettore di colonna con tutti gli elementi uguali a 1.
In parole, l'affermazione è che l'incarico è casuale se un vettore di incarichi che include incarichi al trattamento è probabile come qualsiasi altro vettore che include incarichi al trattamento.
Ma, per garantire l'indipendenza dei potenziali risultati dall'assegnazione del trattamento, è sufficiente garantire che ogni unità nello studio abbia pari probabilità di assegnazione al trattamento. E ciò può accadere facilmente anche se la maggior parte dei vettori di assegnazione del trattamento ha zero probabilità di essere selezionata. Cioè, può accadere anche in caso di assegnazione non casuale.
Ecco un esempio Vogliamo eseguire un esperimento con quattro unità in cui vengono trattate esattamente due. Esistono sei vettori di assegnazione possibili:
- 1100
- 1010
- 1001
- 0110
- 0101
- 0011
dove la prima cifra in ciascun numero indica se la prima unità è stata trattata, la seconda cifra indica se la seconda unità è stata trattata e così via.
Supponiamo di eseguire un esperimento in cui escludiamo la possibilità di assegnare i vettori 3 e 4, ma in cui ciascuno degli altri vettori ha pari (25%) possibilità di essere scelto. Questo schema non è un'assegnazione casuale in senso AIR. Ma in previsione, porta a una stima imparziale dell'effetto medio del trattamento. E questo non è un caso. Qualsiasi schema di assegnazione che dia ai soggetti pari probabilità di assegnazione al trattamento consentirà una stima imparziale dell'ATE.
Quindi: perché abbiamo bisogno di assegnazioni casuali in senso AIR? La mia argomentazione è radicata nell'inferenza di randomizzazione; se si pensa invece in termini di inferenza basata sul modello, la definizione di AIR sembra più difendibile?