Come costruire un intervallo di confidenza al 95% della differenza tra mediane?


27

Il mio problema: uno studio randomizzato di gruppo parallelo con una distribuzione molto distorta dell'outcome primario. Non voglio assumere la normalità e usare IC al 95% su base normale (ovvero usando 1,96 X SE).

Mi sento a mio agio nell'esprimere la misura della tendenza centrale come mediana, ma la mia domanda è quindi come costruire un IC al 95% della differenza nelle mediane tra i due gruppi.

La prima cosa che mi viene in mente è il bootstrap (ricampionare con la sostituzione, determinare la mediana in ciascuno dei due gruppi e sottrarre l'uno dall'altro, ripetere 1000 volte e utilizzare il CI al 95% corretto da bias). È questo l'approccio corretto? Altri suggerimenti?


3
Questa è stata la prima cosa che mi è venuta in mente. Quanto è grande un campione che hai?
jbowman,

40 persone in ciascuno dei due gruppi = 80 in totale.
pmgjones,

3
È possibile esaminare l'intervallo di confidenza non parametrico e lo stimatore per la differenza dei parametri di posizione in base allo stimatore di Hodges-Lehmann . Come spiegato nella pagina di aiuto per R wilcox.test()(sotto Details), questo è strettamente correlato alla differenza nelle mediane, ma non è la stessa cosa.
Caracal,

2
Per quanto riguarda il bootstrap della mediana, potrebbe essere utile leggere il bootstrap levigato.
Caracal,

@caracal: questo è un buon punto. Sia il solito bootstrap liscio che quello corretto hanno una copertura asintotica corretta, ma la probabilità di copertura del bootstrap liscio converge a una velocità leggermente più veloce. Se ricordo bene, |P(mio^n)-0.95|=O(n-1/3) per il solito bootstrap, e O(n-2/5) per il bootstrap levigata. C'è una breve discussione di questo con ulteriori riferimenti nella regressione quantistica di Koenker (2005).
paul

Risposte:


10

La procedura bootstrap che descrivi dovrebbe essere valida. Tuttavia, è importante tenere presente che, come un IC normale al 95% su base normale, un intervallo di confidenza bootstrap è garantito per avere una copertura corretta solo asintoticamente. Una cosa bella del lavorare con la mediana o altri quantili è che è possibile costruire intervalli di confidenza del campione precisi con ipotesi molto deboli. L'idea di base è che sotto il null quella mediana di è m , l'indicatore per y < m è una variabile casuale 0,5 di Bernoulli. È possibile utilizzare questa osservazione per creare una statistica di prova con una distribuzione del campione definita finita. Vedi Chernozhukov, Hansen, Jansson (2009) per maggiori dettagli.ymy<m


1
Potresti spiegare cosa intendi che è valido solo asintoticamente? Non sono sicuro di cosa significhi asintoticamente in questo contesto. Grazie!
pmgjones,

@pmgjones: A 95% intervallo di , per qualche parametro m è tale che P ( m I n ) = 0,95 per tutti i possibili m (o realmente tutti i possibili dati generano processi). Ho scritto io n sottolineare che l'intervallo è una funzione del vostro campione. Per il bootstrap o intervallo di confidenza basati normale, non è vero che P ( m I n ) = 0,95io^nmP(mio^n)=0.95mio^nP(mio^n)=0.95limnP(mio^n)=0.95

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.