Come si segnala un test di Mann – Whitney?


10

Sto facendo la mia tesi di laurea e sto conducendo una serie di test. Dopo aver usato un test Kruskal – Wallis, di solito riporto il risultato in questo modo:

Esiste una differenza significativa tra i mezzi di ...(χ(2)2=7.448,p=.024)

Ma ora ho condotto un test di Mann-Whitney e non sono sicuro di quali valori presentare. SPSS mi dà un Mann-Whitney , Wilcoxon , e -value. Presento tutti questi 4 valori? O sono irrilevanti?UWZP

Risposte:


12

Wikipedia sembra avere le tue risposte. Ecco un estratto dall'esempio dei risultati:

Nel riportare i risultati di un test di Mann-Whitney, è importante dichiarare:

  • Una misura delle tendenze centrali dei due gruppi (medie o mediane; poiché il Mann-Whitney è un test ordinale, le mediane sono generalmente consigliate)
  • Il valore di U
  • Le dimensioni del campione
  • Il livello di significatività.

In pratica alcune di queste informazioni potrebbero essere già state fornite e dovrebbe essere usato il buon senso nel decidere se ripeterle. Potrebbe essere eseguito un tipico rapporto,

"Le latenze mediane nei gruppi E e C erano 153 e 247 ms; le distribuzioni nei due gruppi differivano significativamente (Mann – Whitney U = 10.5, n 1 = n 2 = 8, P <0,05 a due code)."

Il test del grado firmato Wilcoxon è appropriato per campioni accoppiati, mentre il test di Mann-Whitney presuppone campioni indipendenti. Tuttavia, secondo Field (2000) , Wilcoxon nell'output SPSS è "una versione diversa di questa statistica, che può essere convertita in un punteggio Z e può quindi essere confrontata con i valori critici della distribuzione normale". Questo spiega anche il tuo punteggio !Wz

Cordiali saluti, Wikipedia aggiunge che, per campioni di grandi dimensioni, è approssimativamente distribuito normalmente. Dati tutti questi valori, si può anche calcolare la dimensione dell'effetto , che nel caso dell'esempio di Wikipedia è 0,319 (un calcolatore è implementato nella sezione 11 qui ). Tuttavia, questa trasformazione della statistica del test dipende dalla normalità approssimativa di , quindi potrebbe essere inaccurata con n s = 8 ( Fritz et al., 2012 ) .Uη2U

PS I risultati del test Kruskal – Wallis non devono essere interpretati come differenze rivelatrici tra i mezzi, tranne in circostanze speciali. Vedi la risposta di @ Glen_b a un'altra domanda, "Differenza tra test ANOVA e Kruskal-Wallis" per i dettagli.

Riferimenti

Field, A. (2000). 3.1. Test di Mann-Whitney. Metodi di ricerca 1: SPSS per Windows parte 3: test non parametrici. Estratto da http://www.statisticshell.com/docs/nonparametric.pdf .
Fritz, CO, Morris, PE e Richler, JJ (2012). Stime delle dimensioni dell'effetto: uso corrente, calcoli e interpretazione. Journal of Experimental Psychology: General , 141 (1), 2–18. PDF disponibile tramite ResearchGate .


3
Qual è lo scopo di riportare il valore di U nell'esempio sopra? Cosa guadagno, come lettore, dal sapere che U aveva 10,5?
ameba,

4
Nell'esempio sopra, si ottiene la capacità di calcolare la esatta , che non viene fornita e può essere utile per la stima della dimensione dell'effetto, la meta-analisi o il controllo della -hacking. Un mio amico e collega @rpierce mi ha anche consigliato di riferire le statistiche dei test per garantire ai lettori che sto facendo le cose in modo corretto in generale, poiché ha scoperto molti articoli pubblicati che lo sbagliavano tramite statistiche dei test non segnalate e associato . ppdf
Nick Stauner,

Interessante. Immagino che questo problema potrebbe essere degno di una domanda separata, che potrei porre qui ad un certo punto. Tuttavia: se si vogliono valori p esatti, si possono riportare valori p esatti! In effetti, il consueto consiglio è di riportare valori p esatti, a meno che non siano molto piccoli, come p <0,0001; ma in questo caso è improbabile che il p-hacking. E la dimensione dell'effetto dovrebbe essere riportata separatamente separatamente, come ad esempio "latenze mediane nei gruppi E e C erano 153 e 247 ms" nella tua citazione da wiki.
ameba,

1
Gruppo Facebook segreto (cioè non ricercabile) per i laureati psichici del nostro alma mater; nessun esempio incluso. Anche io sono curioso. Forse puoi convincerlo a condividerne alcuni se lo tagghi in una domanda separata :) Scommetto che altri qui avrebbero un sacco di esempi con cui intervenire, cioè se la domanda non viene chiusa come in qualche modo fuori tema ! Sicuramente una domanda più elementare come "Perché è importante segnalare le statistiche dei test oltre alle dimensioni di ed effetto?" sarei in tema però, penso ... Controlla prima i duplicati sotto il tag di segnalazione , se vuoi davvero essere al sicuro ...p
Nick Stauner,

1
Laddove le dimensioni del campione non sono così piccole da essere interpretate erroneamente, propenderei per segnalare un U o W standardizzato (standardizzato, sono identici) come valore Z ( dire ), perché i lettori avranno un senso intuitivo di cosa significhi - anche se allora diventa necessario essere chiari quando si ha il valore p esatto se lo si fa, non uno basato sul punteggio Z per la statistica. ZU
Glen_b -Restate Monica
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.