Calcolo della dimensione del campione parametrico e analisi non parametrica


12

Sono curioso di sapere se qualcuno ha un riferimento specifico (testo o articolo di giornale) per supportare la pratica comune nella letteratura medica di eseguire il calcolo della dimensione del campione usando metodi parametrici (cioè ipotizzando una distribuzione normale e una certa varianza di misurazioni) quando l'analisi del risultato della sperimentazione primaria verrà effettuata utilizzando metodi non parametrici.

Un esempio: l'outcome primario è il tempo di vomito dopo l'assunzione di un determinato farmaco, che è noto per avere un valore medio di 20 minuti (DS 6 minuti), ma ha una distribuzione notevolmente distorta. Il calcolo della dimensione del campione viene eseguito con le ipotesi sopra elencate, usando la formula

n(per-group)=f(α,β)×(2σ2/(μ1μ2)2) ,

dove cambia in base agli errori e desiderati .α βf(α,β)αβ

Tuttavia, a causa dell'asimmetria della distribuzione, l'analisi del risultato primario sarà basata su gradi (metodo non parametrico come il test U di Mann Whitney).

Questo schema è supportato dagli autori nella letteratura statistica o dovrebbero essere eseguite stime non parametriche sulla dimensione del campione (e come dovrebbero essere fatte)?

I miei pensieri sono che, per facilità di calcolo, è accettabile fare la pratica di cui sopra. Dopotutto, le stime sulla dimensione del campione sono proprio questo - stime che fanno già diverse ipotesi - che sono tutte probabilmente leggermente (o molto!) Imprecise. Tuttavia, sono curioso di sapere cosa pensano gli altri e in particolare di sapere se ci sono riferimenti a supporto di questa linea di ragionamento.

Mille grazie per qualsiasi aiuto.

Risposte:


4

Mi sembra schifoso. I metodi non parametrici comportano quasi sempre più gradi di libertà rispetto ai metodi parametrici e pertanto necessitano di più dati. Nel tuo esempio particolare, il test di Mann-Whitney ha una potenza inferiore rispetto al test t e quindi sono necessari più dati per la stessa potenza e dimensione specificate.

Un modo semplice per eseguire il calcolo della dimensione del campione per qualsiasi metodo (non parametrico o di altro tipo) consiste nell'utilizzare un approccio bootstrap.


5
Sono d'accordo con te, anche se la maggior parte del calcolo delle dimensioni del campione che viene effettuato durante l'elaborazione di RCT si basa su modelli parametrici. Mi piace l'approccio bootstrap, ma sembra che pochissimi studi si basino su di esso. Ho appena trovato quei documenti che potrebbero essere interessanti: bit.ly/djzzeS , bit.ly/atCWz3 , e questo va nella direzione opposta bit.ly/cwjTHe per le scale di misurazione della salute.
chl,

6
Sono d'accordo sull'approccio bootstrap. Ma il potere non è una funzione dei gradi di libertà. In molti casi, incluso questo, il test di Mann-Whitney ha spesso una potenza maggiore rispetto al test t. Vedi tbf.coe.wayne.edu/jmasm/sawilowsky_misconceptions.pdf . In generale, la potenza di un test parametrico è buona quando le assunzioni parametriche sono vere ma possono essere inferiori - a volte drasticamente - quando tali assunzioni sono violate, mentre i buoni test non parametrici mantengono il loro potere.
whuber

@RobHyndman - mi dispiace scavare una vecchia discussione di 6 anni fa, ma mi chiedo se puoi fornire un riferimento per la tua ultima frase. Come posso utilizzare un approccio bootstrap per ottenere un calcolo delle dimensioni del campione? Sto assumendo qui che non ho ancora raccolto i dati (perché sto cercando di capire quanto raccogliere), ma conosco la potenza che desidero, il livello di significatività e la dimensione dell'effetto che voglio rilevare. Grazie!
David White,

Okay, immagino che possa funzionare solo se hai uno studio preliminare da cui ricominciare. Per un primo studio senza conoscenze preliminari sembra meglio calcolare la dimensione dell'effetto dalla distribuzione normale (o da una distribuzione diversa se la teoria suggerisce che i dati dovrebbero essere distribuiti in quel modo) e aggiungere un po 'per tenere conto di possibili non-normalità. Una volta che hai uno studio, puoi utilizzare il boostrapping per calcolare le dimensioni dei campioni per rilevare varie dimensioni degli effetti negli studi successivi. Potresti anche adattare una curva di dimensioni dell'effetto rispetto a n in base al bootstrap di diversi valori di n.
David White,

4

Alcune persone sembrano utilizzare un concetto di Pitman Asymptotic Relative Efficiency (ARE) per gonfiare la dimensione del campione ottenuta utilizzando una formula della dimensione del campione per un test parametrico. Ironia della sorte, per calcolarlo, si deve assumere di nuovo una distribuzione ... vedere ad esempio la dimensione del campione per il test U di Mann-Whitney Ci sono alcuni collegamenti alla fine dell'articolo che forniscono indicazioni per ulteriori letture.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.