La randomizzazione in un campione non casuale può ancora mostrare un effetto non ragionevolmente spiegato da una variazione casuale.
Ad esempio, immaginiamo di avere una popolazione con due sottogruppi non riconosciuti (con caratteristiche alquanto diverse *) di dimensioni approssimativamente uguali, ma il campione è non casuale, con una divisione 80/20. Immaginiamo 2 gruppi di trattamento di uguali dimensioni. La randomizzazione (almeno con campioni di dimensioni decenti) tenderà a dare quasi quella suddivisione 80/20 in ciascun gruppo, in modo che gli effetti del trattamento siano dovuti al trattamento, piuttosto che un'allocazione disuguale dei gruppi eterogenei ai trattamenti.
* portando a diversi mezzi di base, diciamo
Il problema si presenta quando si desidera estendere l'inferenza a una popolazione target diversa da quella rappresentativa del proprio campione (gli auto-selettori); questo richiede ipotesi / un argomento per il quale potresti non avere prove (come supporre che le differenze di trattamento siano coerenti per tutti i sottogruppi della popolazione).
Per una situazione simile, immagina di testare un farmaco per l'ipertensione solo sugli uomini, rispetto a un trattamento standard e al placebo. Supponiamo che gli uomini siano adeguatamente randomizzati al gruppo di trattamento. Un effetto terapeutico sarà reale nel senso che descrive davvero un effetto negli uomini. La difficoltà arriverà quando si cerca di estendere tale inferenza alle donne .
Quindi, se vengono condotti correttamente e randomizzati a parte il reclutamento, un effetto osservato osservato sarà quello che sembra, ma si applicherà a ciò che hai effettivamente campionato, non necessariamente a quello che il tuo obiettivo desiderato era: colmare il divario tra i due maggio richiede un'attenta discussione; tale argomento è spesso assente.
Quando ero uno studente era abbastanza comune che gli esperimenti di psicologia fossero condotti su studenti di psicologia, che ci si aspettava che si offrissero volontari per un certo numero di ore di tali esperimenti (questo potrebbe essere ancora il caso, ma non ho contatti regolari con gli psicologi chi fa più esperimenti). Con la randomizzazione al trattamento, le inferenze potrebbero essere state valide (a seconda di ciò che è stato fatto) ma si applicherebbero alla popolazione locale di laureandi di psicologia auto-selezionati (in quanto generalmente scelgono gli esperimenti a cui iscriversi), che sono molto lontani da un campione casuale della popolazione più ampia.