Formula delle dimensioni del campione per un test F?


12

Mi chiedo se esiste una formula per la dimensione del campione come la formula di Lehr che si applica a un test F? La formula di Lehr per i test t è , dove è la dimensione dell'effetto ( ad esempio ). Questo può essere generalizzato a dove è una costante che dipende dalla velocità di tipo I, dalla potenza desiderata e dal fatto che si stia eseguendo un test unilaterale o bilaterale.n=16/Δ2Δ Δ=(μ1μ2)/σn=c/Δ2c

Sto cercando una formula simile per un test F. La mia statistica di test è distribuita, in alternativa, come una F non centrale con gradi di libertà e parametro di non centralità , dove dipende solo da parametri di popolazione, che sono sconosciuti ma si presume abbiano valore . Il parametro è fissato dall'esperimento e è la dimensione del campione. Idealmente sto cercando una formula (preferibilmente ben nota) della forma dove dipende solo dalla velocità di tipo I e dalla potenza.k,nnλλkn

n=cg(k,λ)
c

La dimensione del campione deve soddisfare dove è il CDF di una F non centrale con dof e il parametro di non centralità e sono i tassi di tipo I e di tipo II. Possiamo presumere che , cioè debba essere "sufficientemente grande".

F(F1(1α;k,n,0);k,n,nλ)=β,
F(x;k,n,δ)k,nδα,βkn n

I miei tentativi di armeggiare con questo in R non sono stati fruttuosi. Ho visto suggerito ma gli accoppiamenti non sono stati molto buoni.g(k,λ)=λ/k+1

modifica: originariamente avevo vagamente affermato che il parametro di non centralità 'dipende' dalla dimensione del campione. A pensarci bene, l'ho trovato troppo confuso, quindi ho chiarito la relazione.

Inoltre, posso calcolare esattamente il valore di risolvendo l'equazione implicita tramite un root finder ( ad esempio il metodo di Brent). Sto cercando un'equazione per guidare la mia intuizione e per usarla come regola empirica.n


1
Per chiarire, è corretto che tu sia già in grado di ottenere la richiesta , ma stai cercando una formula generale? Sarei molto sorpreso se ci fosse una formula generale utile. n
mark999,

Risposte:


1

Mi chiedo se esiste una formula per la dimensione del campione come la formula di Lehr che si applica a un test F?

La pagina web " Power Tools for Epidemiologists " spiega:

  • Differenza tra due mezzi (Lehr):

    Supponiamo, ad esempio, di voler dimostrare una differenza di 10 punti nel QI tra due gruppi, uno dei quali è esposto a una potenziale tossina, l'altro no. Utilizzando un QI di popolazione medio di 100 e una deviazione standard di 20:

    ngroup=16(10090/20)2

    ngroup=16(.5)2=64
  • Variazione percentuale nei mezzi

    I ricercatori clinici possono essere più a proprio agio nel pensare in termini di variazioni percentuali piuttosto che differenze di mezzi e variabilità. Ad esempio, qualcuno potrebbe essere interessato a una differenza del 20% tra due gruppi di dati con una variabilità di circa il 30%. Il professor van Belle presenta un approccio pulito a questo tipo di numeri che utilizza il coefficiente di variazione (cv) 4 e traduce la variazione percentuale in un rapporto di medie.

    La varianza sulla scala del log (vedere il capitolo 5 in van Belle) è approssimativamente uguale al coefficiente di variazione sulla scala originale, quindi la formula di Lehr può essere tradotta in una versione che utilizza cv

    ngroup=16(c.v.)2(ln(μ0)ln(μ1))2

    Possiamo quindi utilizzare la variazione percentuale come rapporto di medie, dove

    r.m.=μ0μ1μ0=1μ1μ0

    per formulare una regola empirica:

    ngroup=16(c.v.)2(ln(r.m.))2

    Nell'esempio sopra, una variazione del 20% si traduce in un rapporto di medie di 1 −20 = 0,80. (Una variazione del 5% comporterebbe un rapporto tra la media di 1 −05 = 0,95; una variazione del 35% 1 −35 = 0,65 e così via.) Quindi, la dimensione del campione per uno studio che cerca di dimostrare un Una variazione del 20% delle medie con dati che variano di circa il 30% rispetto alle medie sarebbe

    ngroup=16(.3)2(ln(.8))2=29

An R function based on this rule would be:

1   nPC<-function(cv, pc){
2       x<-16*(cv)^2/((log((1-pc)))^2)
3       print(x)
4   }

Say you were interested in a 15% change from one group to another, but were uncertain about how the data varied. You could look at a range of values for the coefficient of variation:

1   a<-c(.05,.10,.15,.20,.30,.40,.50,.75,1)
2   nPC(a,.15)

You could use this to graphically display your results:

1   plot(a,nPC(a,.15),  ylab="Number in Each Group", 
2   xlab="By Varying Coefficent of Variation", 
3   main="Sample Size Estimate for a 15% Difference")

Vedi anche: iSixSigma " Come determinare la dimensione del campione " e RaoSoft " Calcolatore della dimensione del campione online ".

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.