L'output della statistica W di wilcox.test () in R è uguale alla statistica U?


22

Recentemente ho letto del test U di Mann-Whitney. Si scopre che per eseguire questo test in R in realtà è necessario eseguire un test Wilcoxon!

La mia domanda: la statistica W di wilcox.testin R è identica alla statistica U?

Risposte:


25

Wilcoxon è generalmente riconosciuto come l'inventore originale del test *, sebbene l'approccio di Mann e Whitney sia stato un grande passo avanti e hanno esteso i casi per i quali è stata tabulata la statistica. La mia preferenza è quella di fare riferimento al test come Wilcoxon-Mann-Whitney, per riconoscere entrambi i contributi (anche Mann-Whitney-Wilcoxon è visto; non mi dispiace neanche quello).

* Tuttavia, l'immagine reale è un po 'più torbida, con molti altri autori che elaborano statistiche uguali o simili su questa volta o prima, o in alcuni casi fornendo contributi strettamente collegati al test. Almeno parte del credito dovrebbe andare altrove.

Il test Wilcoxon e il test U di Mann-Whitney sono equivalenti (e l'aiuto indica che lo sono) in quanto rifiutano sempre gli stessi casi nelle stesse circostanze; al massimo le loro statistiche di test differiranno solo per uno spostamento (e in alcuni casi, forse solo un cambio di segno).

Il test di Wilcoxon è definito in più di un modo in letteratura (e quell'ambiguità risale alla tabulazione originale della statistica del test, più che in un momento), quindi bisogna fare attenzione con il quale si sta discutendo il test di Wilcoxon.

Le due forme più comuni di definizione sono discusse in questa coppia di post:

Test di somma dei ranghi di Wilcoxon in R

Modi diversi per calcolare la statistica test per il test somma rango Wilcoxon

Per affrontare cosa, nello specifico, succede in R:

La statistica usata da wilcox.testin R è definita nella guida ( ?wilcox.test), e qui viene spiegata la questione della relazione con la statistica U di Mann-Whitney:

La letteratura non è unanime in merito alle definizioni della somma dei ranghi di Wilcoxon e ai test di Mann-Whitney

Le due definizioni più comuni corrispondono alla somma dei ranghi del primo campione con il valore minimo sottratto o meno: R sottrae e S-PLUS no, dando un valore maggiore di m (m + 1) / 2 per un primo campione di taglia m. (Sembra che il documento originale di Wilcoxon abbia usato la somma non corretta dei ranghi ma le tabelle successive hanno sottratto il minimo.)

Il valore di R può anche essere calcolato come il numero di tutte le coppie (x[i], y[j])per le quali y[j]non è maggiore di x[i], la definizione più comune del test di Mann-Whitney.

Quest'ultima frase risponde completamente a quell'aspetto della tua domanda: la versione di W che R mette in evidenza * è anche il valore di U.

* La somma dei gradi nel campione 1, meno il valore più piccolo che può assumere (cioè meno ).n1(n1+1)2


7

Sia il test di somma di rango di Wilcoxon che il test di Mann-Whitney sono equivalenti non parametrici del test di t indipendente . In alcuni casi la versione di W che R dà, è anche la valua di U. Ma non in tutti i casi.

Quando usi: wilcox.test(df$var1 ~ df$var2, paired=FALSE)la data W è la stessa di U. Quindi puoi segnalarla come statistica U di Mann-Whitney.

Tuttavia, quando usi wilcox.test(df$var1 ~ df$var2, paired=TRUE):, stai effettivamente eseguendo un test di rango firmato Wilcoxon. Il test di rango firmato Wilcoxon è l'equivalente del test t dipendente .

Fonte: "Dicovering statistics using R" di Andy Field (2013)


1
Una buona idea per sottolineare che se usi l'argomento paired=TRUEnon è il Wilcoxon-Mann-Whitney ma il grado firmato.
Glen_b

1

Si noti tuttavia che il codice: wilcox.test(df$var1 ~ df$var2, paired=FALSE)(usando '~')

produrrà una statistica W diversa da una: wilcox.test(df$var1, df$var2, paired=FALSE)(usando ',')


Benvenuto nel sito, @Tilen. Era inteso come una risposta alla domanda del PO, un commento che chiedeva chiarimenti al PO o a uno dei rispondenti o una nuova domanda personale? Utilizza solo il campo "La tua risposta" per fornire le risposte alla domanda originale. Sarai in grado di commentare ovunque quando la tua reputazione è> 50. Se hai una nuova domanda, fai clic sul grigio ASK QUESTION nella parte superiore della pagina e ponila lì, quindi possiamo aiutarti correttamente. Dato che sei nuovo qui, potresti voler partecipare al nostro tour , che contiene informazioni per i nuovi utenti.
gung - Ripristina Monica

Mille grazie @gung. In effetti, era una specie di risposta e domanda, immagino. Grazie per i suggerimenti. Non vedo l'ora di far parte di questo.
Fino al

Le "risposte" sono solo per le risposte dirette alla domanda. Puoi modificarlo per renderlo più puramente una risposta?
gung - Ripristina Monica

Mi dispiace per quello. L'ho modificato ora. Ora sembra migliore?
Fino al

1
Non c'è bisogno di scusarsi. Penso che la tua risposta sia implicita in quello che hai messo qui, ma la gente dovrà leggere tra le righe. Puoi renderlo esplicito e legarlo tutto in un arco? Tuttavia, non sono sicuro che sia giusto. Per utilizzare la versione della formula, è necessario un vettore di valori e un indicatore di raggruppamento. Ad es wilcox.test(values~ind, with(df, stack(var1=var1, var2=var2)), paired=FALSE). Quando lo faccio, ottengo lo stesso in Wentrambi i modi.
gung - Ripristina Monica
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.