Valori critici di Wilcoxon-Mann-Whitney in R


10

Ho notato che quando provo a trovare i valori critici per l'U Mann-Whitney usando R, i valori sono sempre 1 + valore critico. Ad esempio, per , il valore critico (a due code) è 8, mentre per , il (a due code ) il valore critico è 22 (controlla le tabelle ), ma:α=.05,n=10,m=5α=.05,n=12,m=8

> qwilcox(.05/2,10,5)
[1] 9
> qwilcox(.05/2,12,8)
[1] 23

Ovviamente non sto prendendo in considerazione qualcosa, ma ... qualcuno potrebbe spiegarmi perché?

Risposte:


17

Penso che la risposta qui potrebbe essere che stai confrontando mele e arance.

F(x)UqwilcoxQ(α)U

Q(α)=inf{xN:F(x)α},α(0,1).

Poiché è discreto, di solito non esiste una tale che , quindi in genere .UxF(x)=αF(Q(α))>α

Ora, considera il valore critico per il test. In questo caso, si desidera , poiché altrimenti si avrà un test con un tasso di errore di tipo I che è maggiore di quello nominale. Questo di solito è considerato indesiderabile; i test conservativi tendono ad essere preferiti. Quindi, A meno che non esista una tale che , abbiamo quindi .C(α)F(C(α))αx F ( x ) = α C ( α ) = Q ( α ) - 1

C(α)=sup{xN:F(x)α},α(0,1).
xF(x)=αC(α)=Q(α)1

Il motivo della discrepanza è che qwilcoxè stato progettato per calcolare i quantili e non i valori critici!


1
(+1) Descrizione buona, semplice, concisa. :)
cardinale

2

Ricorda che la statistica del test somma somma è discreta e quindi devi usare un valore critico tale che la probabilità di coda sia rispetto al specificato . Per alcune dimensioni del campione non è possibile raggiungere l'alfa e questa è la mia ipotesi sul motivo per cui è necessario il +1.αα


4
Quindi perché è necessario +1 in R e non nelle solite tabelle?
Martedì

1
@ this.is.not.a.nick: forse ancora più importante, mentre , il che significa che nel primo caso il livello di significatività reale sarà e che nel secondo sarà . Di solito le persone tendono a preferire errare sul lato destro, cioè avere un livello di significatività inferiore rispetto a quello nominale (il che significa che i valori delle tabelle sono preferibili). 0,02868937 > 0,025 < 0,05 > 0,050.0236723<0.0250.02868937>0.025<0.05>0.05
Martedì

1
Diritto sia a Procrastinator che a MansT. In realtà la definizione del livello di significatività richiede che le probabilità di coda non si sommino a qualcosa di più alto dell'alfa. Ne parlo nel mio articolo con Christine Liu sul comportamento a denti di sega della funzione di potenza per test binomiali esatti tramite il metodo Clopper-Pearson (vedi American Statistician (2002)).
Michael R. Chernick,

2
@Michael: è sulla stessa pagina di questa. Le tabelle seguono la definizione standard, il che significa che i valori critici non sono quantili.
Martedì

3
@Michael: concordato. In un certo senso, qwilcoxfa quello che dovrebbe fare, ma non quello che ti aspetteresti.
Martedì
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.