Adeguatezza del test di rango firmato Wilcoxon


11

Ho cercato un po 'negli archivi con convalida incrociata e non sono riuscito a trovare una risposta alla mia domanda. La mia domanda è la seguente: Wikipedia fornisce tre ipotesi che devono essere confermate per il test di rango firmato Wilcoxon (leggermente modificato per le mie domande):

Lascia che Zi = Xi-Yi per i = 1, ..., n.

  1. Si presume che le differenze Zi siano indipendenti.

  2. (a.) Ogni Zi proviene dalla stessa popolazione continua e (b.) ogni Zi è simmetrico rispetto a una mediana comune;

  3. I valori rappresentati da Xi e Yi sono ordinati ... quindi sono utili i confronti "maggiore di", "minore di" e "uguale a".

La documentazione per? Wilcox.test in R, tuttavia, sembra indicare che (2.b) è in realtà qualcosa che viene testato dalla procedura:

"... se sia x che y sono dati e accoppiati è TRUE, viene eseguito un test di rango con segno di Wilcoxon del null che viene eseguita la distribuzione ... di x - y (nel caso di due campioni accoppiati) su mu."

Mi sembra che il test venga eseguito per l'ipotesi nulla secondo cui "Z è distribuito simmetricamente attorno alla mediana mu = SomeMu" - tale che il rifiuto del nulla potrebbe essere sia un rifiuto della simmetria o un rifiuto che il mu attorno al quale Z è simmetrico è SomeMu.

È una comprensione corretta della documentazione R per wilcox.test? La ragione per cui questo è importante, ovviamente, è che sto conducendo una serie di test di differenza accoppiata su alcuni dati prima e dopo ("X" e "Y" sopra). I dati "prima" e "dopo" singolarmente sono fortemente distorti, ma le differenze non sono distorte quasi altrettanto (sebbene siano ancora leggermente distorte). Con ciò intendo che i dati "prima" o "dopo" considerati da soli hanno un'asimmetria ~ 7-21 (a seconda del campione che sto esaminando), mentre i dati "differenze" hanno asimmetria ~ = 0,5 a 5. Ancora inclinati, ma non altrettanto.

Se avere l'asimmetria nei miei dati sulle "differenze" farà sì che il test di Wilcoxon mi dia risultati falsi / distorti (come l'articolo di Wikipedia sembra indicare), allora l'asimmetria potrebbe essere una grande preoccupazione. Se, tuttavia, i test di Wilcoxon stanno effettivamente testando se la distribuzione delle differenze è "simmetrica intorno a mu = SomeMu" (come sembra indicare? Wilcox.test), allora questo è meno preoccupante.

Quindi le mie domande sono:

  1. Quale interpretazione sopra è corretta? L'asimmetria nella mia distribuzione delle "differenze" influenzerà il mio test di Wilcoxon?

  2. Se l'asimmetria è una preoccupazione: "Quanta asimmetria è una preoccupazione?"

  3. Se i test dei ranghi firmati Wilcoxon qui sembrano decisamente inappropriati, qualche suggerimento su cosa dovrei usare?

Grazie mille. Se hai ulteriori suggerimenti su come potrei fare questa analisi, sono più che felice di ascoltarli (anche se posso anche aprire un altro thread a tale scopo). Inoltre, questa è la mia prima domanda su Cross Validated; se hai suggerimenti / commenti su come ho posto questa domanda, sono aperto anche a quello!


Un po 'di storia: sto analizzando un set di dati che contiene osservazioni su quelli che chiamerò "errori nella produzione aziendale". Ho un'osservazione sugli errori che si verificano nel processo di produzione prima e dopo un'ispezione a sorpresa e uno degli obiettivi dell'analisi è di rispondere alla domanda "l'ispezione fa la differenza nel numero oberved di errori?"

Il set di dati è simile al seguente:

ID, errorsBefore, errorsAfter, size_large, size_medium, typeA, typeB, typeC, typeD
0123,1,1,1,0,1,1,1,0 
2345,1,0,0,0,0,1,1,0
6789,2,1,0,1,0,1,0,0
1234,8,8,0,0,1,0,0,0

Ci sono circa 4000 osservazioni. Le altre variabili sono osservazioni catagoriche che descrivono le caratteristiche delle imprese. Le dimensioni possono essere piccole, medie o grandi e ogni impresa è una e solo una di quelle. Le imprese possono essere uno o tutti i "tipi".

Mi è stato chiesto di eseguire alcuni semplici test per vedere se c'erano differenze statisticamente significative nei tassi di errore osservati prima e dopo le ispezioni per tutte le aziende e vari sottogruppi (in base alle dimensioni e al tipo). I test T erano in sospeso perché i dati erano gravemente distorti sia prima che dopo, ad esempio, in R i dati precedenti erano simili al seguente:

summary(errorsBefore)
# Min.  1st Qu.  Median   Mean  3rd Qu.    Max
# 0.000  0.000    4.000  12.00    13.00  470.0

(Questi sono inventati - temo di non poter pubblicare i dati effettivi o eventuali manipolazioni reali a causa di problemi di proprietà / privacy - le mie scuse!)

Le differenze accoppiate erano più centralizzate ma ancora non ben adattate da una distribuzione normale - decisamente troppo elevate. I dati sulle differenze assomigliavano a questo:

summary(errorsBefore-errorsAfter)
# Min.   1st Qu.  Median   Mean  3rd Qu.    Max
# -110.0  -2.000   0.000  0.005   2.000   140.0

Mi è stato suggerito di usare un test di rango firmato da Wilcoxon, e dopo una breve persecuzione di? Wilcox.test e Wikipedia, e qui, questo sembra il test da usare. Considerando le ipotesi di cui sopra, credo che (1) vada bene dato il processo di generazione dei dati. Il presupposto (2.a) non è strettamente vero per i miei dati, ma la discussione qui: alternativa al test di Wilcoxon quando la distribuzione non è continua? sembrava indicare che questo non era troppo preoccupante. L'assunzione (3) va bene. La mia unica preoccupazione (credo) è Assunzione (2.b).

Una nota aggiuntiva , alcuni anni dopo: alla fine ho seguito un eccellente corso di statistica non parametrica e ho trascorso molto tempo nei test di somma dei ranghi. Incorporato nell'ipotesi (2.a), "Ogni Zi proviene dalla stessa popolazione continua", è l'idea che entrambi i campioni vengano da popolazioni con uguale varianza - questo si rivela estremamente importante, praticamente parlando. Se hai dubbi sulla diversa varianza nelle tue popolazioni (da cui attingi i campioni), dovresti preoccuparti di usare WMW.


Grazie per le due risposte! Entrambi mi hanno aiutato abbastanza equamente. Avrei "scelto entrambi" se potessi. Mike mi ha indicato una parte della comprensione teorica, che è stata molto utile concettualmente, anche se quella di Aniko stava rispondendo un po 'più direttamente alla mia domanda originale. Grazie a tutti e due!
CompEcon,

Risposte:


8

Wikipedia ti ha indotto in errore affermando "... se sia x che y sono dati e accoppiati è TRUE, un test di rango firmato da Wilcoxon del null indica che la distribuzione ... di x - y (nel caso di due campioni accoppiati) è simmetrica su mu viene eseguita ".

Il test determina se i valori RANK-TRANSFORMED di sono simmetrici attorno alla mediana specificata nell'ipotesi nulla (suppongo che zero). L'asimmetria non è un problema, dal momento che il test di livello firmato, come la maggior parte dei test non parametrici, è "privo di distribuzione". Il prezzo da pagare per questi test è spesso una potenza ridotta, ma sembra che tu abbia un campione abbastanza grande per superarlo.zi=xiyi

Un'alternativa "che diavolo" al test di somma dei ranghi potrebbe essere quella di provare una semplice trasformazione come e nel caso in cui queste misurazioni possano seguire approssimativamente una distribuzione lognormale - quindi il log i valori dovrebbero apparire "campanosi". Quindi potresti usare durante il test e convincere te stesso (e il tuo capo che ha preso solo le Statistiche aziendali) che il test di somma dei ranghi sta funzionando. Se funziona, c'è un vantaggio: il test t sui mezzi per i dati lognormali è un confronto di mediane per le misurazioni originali, non trasformate.ln(xi)ln(yi)

Me? Farei entrambe le cose, e qualsiasi altra cosa potrei cucinare (test del rapporto di verosimiglianza sui conteggi di Poisson per dimensioni solide?). I test di ipotesi si basano sul determinare se le prove sono convincenti e alcune persone prendono un mucchio di convincere.


Ah, ha molto senso. Soprattutto ora che sono tornato a casa e ho tirato fuori il mio vecchio libro di testo DeGroot & Schervish, che ha una bella descrizione di ciò che questi test sui segni stanno effettivamente facendo. Fantastico. E grazie per le considerazioni generali sui test di ipotesi :) Mi piace la prospettiva. Una nota minore: la parte che noti come fuorviante proviene in realtà da R, dalla documentazione per wilcox.test. Questo mi disturba un po '...
CompEcon,

9

Sia Wikipedia che la pagina di aiuto di R sono in qualche modo corretti e stanno cercando di affermare la stessa cosa, semplicemente la definiscono diversamente.

L'articolo di Wikipedia afferma le ipotesi come (mediana = 0) vs (mediana! = 0) e dice che puoi concludere questo dal test se le differenze hanno una distribuzione simmetrica (+ le altre ipotesi).

La pagina di aiuto di R è più specifica, indica le ipotesi come (mediana = 0 e le differenze hanno una distribuzione simmetrica) vs (almeno una di queste è falsa). Quindi ha spostato un'ipotesi nell'ipotesi nulla. Penso che abbiano fatto questo per enfatizzare la necessità di simmetria: con differenze distorte il test del grado firmato rigetterà l'ipotesi nulla anche se la mediana è morta. Se leggi un libro di testo, potresti anche dirti che l'ipotesi nulla in fase di test è P (X> Y) = 0,5 - il resto in realtà segue solo questo.

In termini di applicazione, la domanda è ovviamente se ti preoccupi specificamente della mediana (e quindi l'asimmetria è un problema, e il test mediano è una possibile alternativa), o se ti preoccupi dell'intera distribuzione, e quindi P (X> y)! = 0,5 è la prova di cambiamenti.


1
Ok, questo ha senso. Grazie per l'input! Ho notato che la pagina di Wikipedia per il test mediano afferma che è preferito il test Mann-Whitney-U non associato. Questo mi fa subito pensare che sono tornato da dove ho iniziato, pensando che il test di Wilcoxon associato in qualche modo utilizza più informazioni. Forse quello che sto davvero cercando di pensare è quello che intendi quando dici "preoccupati specificamente della mediana ... o dell'intera distribuzione". Mi interessa l'intera distribuzione, ma la sto caratterizzando attraverso la mediana.
CompEcon,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.