Trovare potere contro alternative esponenziali di spostamento della scala è ragionevolmente semplice.
Tuttavia, non so che dovresti usare i valori calcolati dai tuoi dati per capire quale potrebbe essere stato il potere. Questo tipo di calcolo della potenza post hoc tende a dare conclusioni contrarie all'intuizione (e forse fuorvianti).
Il potere, come il livello di significatività, è un fenomeno che affronti prima del fatto; useresti una comprensione a priori (compresa la teoria, il ragionamento o eventuali studi precedenti) per decidere su una serie ragionevole di alternative da considerare e una dimensione dell'effetto desiderabile
Puoi anche prendere in considerazione una varietà di altre alternative (ad esempio potresti incorporare l'esponenziale all'interno di una famiglia gamma per considerare l'impatto di casi più o meno distorti).
Le solite domande a cui si potrebbe provare a rispondere mediante un'analisi di potenza sono:
1) qual è il potere, per una data dimensione del campione, con una certa dimensione dell'effetto o insieme di dimensioni dell'effetto *?
2) date le dimensioni e la potenza del campione, quanto è rilevabile un effetto?
3) Data la potenza desiderata per una particolare dimensione dell'effetto, quale dimensione del campione sarebbe richiesta?
* (dove qui 'dimensione dell'effetto' è intesa genericamente e potrebbe essere, ad esempio, un particolare rapporto di mezzi, o differenza di mezzi, non necessariamente standardizzato).
Chiaramente hai già una dimensione del campione, quindi non sei nel caso (3). Si potrebbe ragionevolmente considerare case (2) o case (1).
Suggerirei case (1) (che fornisce anche un modo per gestire case (2)).
Per illustrare un approccio a case (1) e vedere come si collega a case (2), consideriamo un esempio specifico, con:
Poiché le dimensioni del campione sono diverse, dobbiamo considerare il caso in cui la diffusione relativa in uno dei campioni è sia inferiore che maggiore di 1 (se avevano le stesse dimensioni, le considerazioni sulla simmetria consentono di considerare solo un lato). Tuttavia, poiché sono abbastanza vicini alle stesse dimensioni, l'effetto è molto piccolo. In ogni caso, correggere il parametro per uno dei campioni e variare l'altro.
Quindi quello che si fa è:
In anticipo:
choose a set of scale multipliers representing different alternatives
select an nsim (say 1000)
set mu1=1
Per fare i calcoli:
for each possible scale multiplier, kappa
repeat nsim times
generate a sample of size n1 from Exp(mu1) and n2 from Exp(kappa*mu1)
perform the test
compute the rejection rate across nsim tests at this kappa
In R, ho fatto questo:
alpha = 0.05
n1 = 54
n2 = 64
nsim = 10000
s = c(1.1,1.2,1.5,2,2.5,3) # set up grid for kappa
s = c(1/rev(s),1,s) # also below and at 1
rr = array(NA,length(s)) # to hold rejection rates
for(i in seq_along(s)) rr[i]=mean(replicate(nsim,
ks.test(rexp(n1,1),rexp(n2,s[i]))$p.value)<alpha
)
plot(rr~s,log="x",ylim=c(0,1),type="n") #set up plot
points(rr~rev(s),col=3) # plot the reversed case to show the (tiny) asymmetry+noise
points(rr~s,col=1) # plot the "real" case last
abline(h=alpha,col=8,lty=2) # draw in alpha
che dà la seguente "curva" di potenza
L'asse x è su una scala logaritmica, l'asse y è il tasso di rifiuto.
È difficile dirlo qui, ma i punti neri sono leggermente più alti a sinistra rispetto a destra (cioè, c'è una potenza leggermente maggiore quando il campione più grande ha la scala più piccola).
Usando il normale cdf inverso come una trasformazione del tasso di rifiuto, possiamo rendere la relazione tra il tasso di rifiuto trasformato e il log kappa (il kappa è s
nella trama, ma l'asse x è scalato in scala logaritmica) molto quasi lineare (tranne vicino a 0 ) e il numero di simulazioni era abbastanza elevato da rendere il rumore molto basso: possiamo praticamente ignorarlo per gli scopi attuali.
Quindi possiamo semplicemente usare l'interpolazione lineare. Di seguito sono riportate le dimensioni approssimative dell'effetto per il 50% e l'80% di potenza alle dimensioni del campione:
Le dimensioni dell'effetto sull'altro lato (il gruppo più grande ha una scala più piccola) sono solo leggermente spostate da quella (può prendere una dimensione dell'effetto leggermente più piccola), ma fa poca differenza, quindi non affronterò il punto.
Quindi il test rileverà una differenza sostanziale (da un rapporto di scale di 1), ma non piccola.
Ora per alcuni commenti: non credo che i test di ipotesi siano particolarmente rilevanti per la domanda di interesse sottostante ( sono abbastanza simili? ), E di conseguenza questi calcoli di potenza non ci dicono nulla di direttamente pertinente a quella domanda.
Penso che tu possa affrontare quella domanda più utile prespecificando cosa pensi che "essenzialmente lo stesso" significhi effettivamente, operativamente. Ciò , perseguito razionalmente in un'attività statistica, dovrebbe condurre a un'analisi significativa dei dati.