Ipotesi nulla di Mann-Whitney sotto varianza diseguale


9

Sono solo curioso dell'ipotesi nulla di un test U di Mann-Whitney. Vedo spesso che l'ipotesi nulla è che due popolazioni abbiano distribuzioni uguali. Ma sto pensando: se avessi due popolazioni normali con la stessa varianza media ma estremamente ineguale, il test di Mann-Whitney probabilmente non rileverebbe questa differenza.

Ho anche visto che l'ipotesi nulla del test di Mann-Whitney è o la probabilità di un'osservazione da una popolazione ( X ) che supera un'osservazione dalla seconda popolazione ( Y ) (dopo esclusione dei legami) è pari a 0,5. Questo sembra avere un po 'più di senso, ma non sembra equivalente alla prima ipotesi nulla che ho affermato.Pr(X>Y)=0.5XY

Spero di ottenere un po 'di aiuto per districare questo. Grazie!

Risposte:


5

Il test di Mann-Whitney è un caso speciale di un test di permutazione (la distribuzione sotto il nullo è derivata osservando tutte le possibili permutazioni dei dati) e i test di permutazione hanno il null come distribuzioni identiche, quindi tecnicamente corretto.

Un modo di pensare alla statistica del test di Mann-Whitney è una misura del numero di volte in cui un valore scelto casualmente da un gruppo supera un valore scelto casualmente dall'altro gruppo. Quindi anche P (X> Y) = 0,5 ha un senso e questa è tecnicamente una proprietà delle distribuzioni uguali nulla (assumendo distribuzioni continue dove la probabilità di un pareggio è 0). Se le 2 distribuzioni sono uguali, allora la probabilità che X sia maggiore di Y è 0,5 poiché entrambi sono disegnati dalla stessa distribuzione.

Il caso dichiarato di 2 distribuzioni aventi la stessa media ma varianze molto diverse corrisponde alla seconda ipotesi nulla, ma non alla prima di distribuzioni identiche. Possiamo fare una simulazione per vedere cosa succede con i valori p in questo caso (in teoria dovrebbero essere distribuiti uniformemente):

> out <- replicate( 100000, wilcox.test( rnorm(25, 0, 2), rnorm(25,0,10) )$p.value )
> hist(out)
> mean(out < 0.05)
[1] 0.07991
> prop.test( sum(out<0.05), length(out), p=0.05 )

        1-sample proportions test with continuity correction

data:  sum(out < 0.05) out of length(out), null probability 0.05
X-squared = 1882.756, df = 1, p-value < 2.2e-16
alternative hypothesis: true p is not equal to 0.05
95 percent confidence interval:
 0.07824054 0.08161183
sample estimates:
      p 
0.07991 

Quindi chiaramente questo viene rifiutato più spesso di quanto dovrebbe e l'ipotesi nulla è falsa (questo corrisponde all'uguaglianza delle distribuzioni, ma non prob = 0,5).

Pensare in termini di probabilità di X> Y si imbatte anche in alcuni problemi interessanti se si confrontano popolazioni basate su Dadi di Efron .


Ciao Greg, grazie per la risposta. Sembra che tu stia dicendo che ho trovato in qualche modo un caso speciale in cui il test non funziona correttamente con le distribuzioni uguali null. Inoltre, le ipotesi nulle che ho affermato non sono uguali. È corretto?
Jimj

4

Mann-Whitney non è sensibile ai cambiamenti nella varianza con media uguale, ma può - come vedi con la forma , rilevare differenze che portano a deviare da (ad es. dove sia la media che la varianza aumentano insieme). Abbastanza chiaramente se tu avessi due normali con uguale media, le loro differenze sono simmetriche rispetto allo zero. Pertanto , che è la situazione nulla.P(X>Y)=0.5P(X>Y)0.5P(X>Y)=P(XY>0)=12

Ad esempio, se la distribuzione di è esponenziale con la media mentre ha una distribuzione esponenziale con media (un cambio di scala), Mann-Whitney è sensibile a ciò (in effetti, prendendo i registri di entrambi i lati, è solo un spostamento di posizione e Mann-Whitney non è influenzato dalla trasformazione monotonica).Y1Xk

-

Se sei interessato a test concettualmente molto simili a quelli di Mann-Whitney che sono sensibili alle differenze nella diffusione sotto l'uguaglianza dei mediani, ci sono molti di questi test.

C'è il test Siegel-Tukey e il test Ansari-Bradley, ad esempio, entrambi strettamente correlati al test a due campioni Mann-Whitney-Wilcoxon.

Entrambi si basano sull'idea di base di classificarsi dalle estremità.

Se usi R, il test Ansari-Bradley è integrato in ... ?ansari.test

Il Siegel-Tukey in effetti fa solo un test di Mann-Whitney-Wilcoxon su ranghi calcolati dal campione in modo diverso; se si classificano i dati da soli, in realtà non è necessaria una funzione separata per i valori p. Tuttavia, puoi trovarne alcuni, come qui:

http://www.r-statistics.com/2010/02/siegel-tukey-a-non-parametric-test-for-equality-in-variability-r-code/

-

(in relazione al commento di ttnphns sotto la mia risposta originale)

Interpreteresti eccessivamente la mia risposta per leggerla in disaccordo con @GregSnow in senso particolarmente sostanziale. C'è sicuramente una differenza nell'enfasi e in una certa misura in ciò di cui stiamo parlando, ma sarei molto sorpreso se ci fosse un vero disaccordo dietro di esso.

Citiamo Mann e Whitney: "Una statistica a seconda dei ranghi relativi delle e è proposta per verificare l'ipotesi . " È inequivocabile; supporta completamente la posizione di @ GregSnow.Uxyf=g

Ora, vediamo come viene costruita la statistica: " Consenti a contare il numero di volte che una precede unaUyx " . Ora, se il loro valore nullo è vero, la probabilità di quell'evento è ... ma ci sono altri modi per ottenere una probabilità di 0,5 e in tal senso si potrebbe pensare che il test possa funzionare in altre circostanze. Nella misura in cui stanno stimando una probabilità (ridimensionata) che > , supporta ciò che ho detto.12YX

Tuttavia, per garantire che i livelli di significatività siano esattamente corretti, è necessario che la distribuzione di corrisponda alla distribuzione nulla. Ciò deriva dal presupposto che tutte le permutazioni delle etichette delle etichette di gruppo e alle osservazioni combinate sotto il valore nullo fossero ugualmente probabili. Questo è certamente il caso di . Esattamente come ha detto @GregSnow.UXYf=g

La domanda è la misura in cui questo è il caso (ovvero che la distribuzione della statistica test corrisponde a quella derivata dal presupposto che , o approssimativamente), per il valore più generalmente espresso nullo.f=g

Credo che in molte situazioni ciò accada; in particolare per situazioni che includono ma più generali di quella che descrivi (due popolazioni normali con la stessa media ma una varianza estremamente diseguale possono essere generalizzate un po 'senza alterare la distribuzione risultante in base ai gradi), credo che la distribuzione della statistica del test risulta avere la stessa distribuzione con cui è stata derivata e quindi dovrebbe essere valida lì. Ho fatto alcune simulazioni che sembrano supportare questo. Tuttavia, non sarà sempre un test molto utile (potrebbe avere uno scarso potere).

Non offro alcuna prova che sia così. Ho applicato un po 'di intuizione / argomento ondulato a mano e ho anche fatto alcune simulazioni di base che suggeriscono che è vero - che il Mann-Whitney funziona (in quanto ha la distribuzione "giusta" sotto il nulla) molto più ampiamente di quando .f=g

Rendi ciò che vuoi, ma non lo considero un sostanziale disaccordo con @GregSnow

Riferimento: documento originale di Mann & Whitney


Ti ho capito giusto che concordate con queste parole dalla pagina di discussione di Mann-Whitney di Wikipedia: the null hypothesis of Mann-Whitney U-test is not about the equality of distributions. Is is about the symmetry between two populations with respect to the probability of obtaining a larger observation. E quindi non sei d'accordo con la risposta di @ Greg, giusto?
ttnphns,

Ho aggiunto alcune discussioni in modifica.
Glen_b

Aggiunta molto bella. Lo studierò (mi sono sempre sentito come se ci fossero sfumature nel test MW che continuano a sfuggirmi). Nel frattempo, concorderai se direi: "Poiché la statistica del test MW riflette solo l'uguaglianza (in) dei ranghi medi , ci possono essere situazioni in cui f ~ = g [intendo f, g come distribuzioni originali, ranking precedente] ma il test è completamente privo di rilevanza poiché continua a trattare lo stesso H0 di cui sotto f = g. Un esempio di tale situazione sono le distribuzioni simmetriche completamente identiche ad eccezione del parametro spread (varianza) ".
ttnphns,

Nella notazione (Mann e Whitney l'altro), e sono le densità di e . Concordo sul fatto che nella misura in cui ho verificato / compreso le circostanze, la tua dichiarazione sembra essere il caso. Ho il sospetto che ci sia ancora molto sul Mann-Whitney che mi sfugge. fgXY
Glen_b
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.