La cosa più semplice da fare sarebbe probabilmente un test sui segni. L'ipotesi nulla è che ogni risultato abbia pari probabilità di essere positivo o negativo (come lanciare una moneta giusta). Il tuo obiettivo è determinare se i risultati osservati sarebbero abbastanza improbabili in base a questa ipotesi nulla da poter essere respinti.
Qual è la probabilità di ottenere 80 o più teste su 100 lanci di una moneta giusta? Puoi calcolarlo usando la distribuzione binomiale. In R
, viene chiamata la funzione pertinente pbinom
e potresti ottenere un valore p (unilaterale) usando la seguente riga di codice:
pbinom(80, size = 100, prob = 0.5, lower.tail = FALSE)
Secondo questo test, la tua intuizione è corretta, sarebbe estremamente improbabile che tu ottenga 80 risultati positivi per caso se il trattamento non avesse effetto.
Un'opzione strettamente correlata sarebbe quella di utilizzare qualcosa come il test di rango firmato Wilcoxon .
Un approccio migliore , se in realtà si desidera stimare la dimensione dell'effetto (piuttosto che determinare semplicemente se tende a essere maggiore di zero o meno), sarebbe probabilmente un modello gerarchico ("misto").
Qui, il modello afferma che i risultati dei tuoi 100 individui provengono da una distribuzione e il tuo obiettivo è vedere dove si trova la media di quella distribuzione (insieme agli intervalli di confidenza).
I modelli misti ti consentono di dire qualcosa in più sulle dimensioni degli effetti: dopo aver adattato il modello, potresti dire qualcosa del tipo "stimiamo che il nostro trattamento tende a migliorare i risultati in media di tre unità, sebbene i dati siano coerenti con la media reale la dimensione dell'effetto va da 1,5 a 4,5 unità. Inoltre, ci sono alcune variazioni tra gli individui, quindi una determinata persona può vedere un effetto ovunque da -0,5 a +6,5 unità ".
Si tratta di una serie di affermazioni molto precise e utili, molto meglio del semplice "l'effetto è probabilmente positivo, in media", motivo per cui questo approccio tende a essere favorito dagli statistici. Ma se non hai bisogno di tutti quei dettagli, anche il primo approccio che ho citato potrebbe andare bene.