Ho cercato un po 'negli archivi con convalida incrociata e non sono riuscito a trovare una risposta alla mia domanda. La mia domanda è la seguente: Wikipedia fornisce tre ipotesi che devono essere confermate per il test di rango firmato Wilcoxon (leggermente modificato per le mie domande):
Lascia che Zi = Xi-Yi per i = 1, ..., n.
Si presume che le differenze Zi siano indipendenti.
(a.) Ogni Zi proviene dalla stessa popolazione continua e (b.) ogni Zi è simmetrico rispetto a una mediana comune;
I valori rappresentati da Xi e Yi sono ordinati ... quindi sono utili i confronti "maggiore di", "minore di" e "uguale a".
La documentazione per? Wilcox.test in R, tuttavia, sembra indicare che (2.b) è in realtà qualcosa che viene testato dalla procedura:
"... se sia x che y sono dati e accoppiati è TRUE, viene eseguito un test di rango con segno di Wilcoxon del null che viene eseguita la distribuzione ... di x - y (nel caso di due campioni accoppiati) su mu."
Mi sembra che il test venga eseguito per l'ipotesi nulla secondo cui "Z è distribuito simmetricamente attorno alla mediana mu = SomeMu" - tale che il rifiuto del nulla potrebbe essere sia un rifiuto della simmetria o un rifiuto che il mu attorno al quale Z è simmetrico è SomeMu.
È una comprensione corretta della documentazione R per wilcox.test? La ragione per cui questo è importante, ovviamente, è che sto conducendo una serie di test di differenza accoppiata su alcuni dati prima e dopo ("X" e "Y" sopra). I dati "prima" e "dopo" singolarmente sono fortemente distorti, ma le differenze non sono distorte quasi altrettanto (sebbene siano ancora leggermente distorte). Con ciò intendo che i dati "prima" o "dopo" considerati da soli hanno un'asimmetria ~ 7-21 (a seconda del campione che sto esaminando), mentre i dati "differenze" hanno asimmetria ~ = 0,5 a 5. Ancora inclinati, ma non altrettanto.
Se avere l'asimmetria nei miei dati sulle "differenze" farà sì che il test di Wilcoxon mi dia risultati falsi / distorti (come l'articolo di Wikipedia sembra indicare), allora l'asimmetria potrebbe essere una grande preoccupazione. Se, tuttavia, i test di Wilcoxon stanno effettivamente testando se la distribuzione delle differenze è "simmetrica intorno a mu = SomeMu" (come sembra indicare? Wilcox.test), allora questo è meno preoccupante.
Quindi le mie domande sono:
Quale interpretazione sopra è corretta? L'asimmetria nella mia distribuzione delle "differenze" influenzerà il mio test di Wilcoxon?
Se l'asimmetria è una preoccupazione: "Quanta asimmetria è una preoccupazione?"
Se i test dei ranghi firmati Wilcoxon qui sembrano decisamente inappropriati, qualche suggerimento su cosa dovrei usare?
Grazie mille. Se hai ulteriori suggerimenti su come potrei fare questa analisi, sono più che felice di ascoltarli (anche se posso anche aprire un altro thread a tale scopo). Inoltre, questa è la mia prima domanda su Cross Validated; se hai suggerimenti / commenti su come ho posto questa domanda, sono aperto anche a quello!
Un po 'di storia: sto analizzando un set di dati che contiene osservazioni su quelli che chiamerò "errori nella produzione aziendale". Ho un'osservazione sugli errori che si verificano nel processo di produzione prima e dopo un'ispezione a sorpresa e uno degli obiettivi dell'analisi è di rispondere alla domanda "l'ispezione fa la differenza nel numero oberved di errori?"
Il set di dati è simile al seguente:
ID, errorsBefore, errorsAfter, size_large, size_medium, typeA, typeB, typeC, typeD
0123,1,1,1,0,1,1,1,0
2345,1,0,0,0,0,1,1,0
6789,2,1,0,1,0,1,0,0
1234,8,8,0,0,1,0,0,0
Ci sono circa 4000 osservazioni. Le altre variabili sono osservazioni catagoriche che descrivono le caratteristiche delle imprese. Le dimensioni possono essere piccole, medie o grandi e ogni impresa è una e solo una di quelle. Le imprese possono essere uno o tutti i "tipi".
Mi è stato chiesto di eseguire alcuni semplici test per vedere se c'erano differenze statisticamente significative nei tassi di errore osservati prima e dopo le ispezioni per tutte le aziende e vari sottogruppi (in base alle dimensioni e al tipo). I test T erano in sospeso perché i dati erano gravemente distorti sia prima che dopo, ad esempio, in R i dati precedenti erano simili al seguente:
summary(errorsBefore)
# Min. 1st Qu. Median Mean 3rd Qu. Max
# 0.000 0.000 4.000 12.00 13.00 470.0
(Questi sono inventati - temo di non poter pubblicare i dati effettivi o eventuali manipolazioni reali a causa di problemi di proprietà / privacy - le mie scuse!)
Le differenze accoppiate erano più centralizzate ma ancora non ben adattate da una distribuzione normale - decisamente troppo elevate. I dati sulle differenze assomigliavano a questo:
summary(errorsBefore-errorsAfter)
# Min. 1st Qu. Median Mean 3rd Qu. Max
# -110.0 -2.000 0.000 0.005 2.000 140.0
Mi è stato suggerito di usare un test di rango firmato da Wilcoxon, e dopo una breve persecuzione di? Wilcox.test e Wikipedia, e qui, questo sembra il test da usare. Considerando le ipotesi di cui sopra, credo che (1) vada bene dato il processo di generazione dei dati. Il presupposto (2.a) non è strettamente vero per i miei dati, ma la discussione qui: alternativa al test di Wilcoxon quando la distribuzione non è continua? sembrava indicare che questo non era troppo preoccupante. L'assunzione (3) va bene. La mia unica preoccupazione (credo) è Assunzione (2.b).
Una nota aggiuntiva , alcuni anni dopo: alla fine ho seguito un eccellente corso di statistica non parametrica e ho trascorso molto tempo nei test di somma dei ranghi. Incorporato nell'ipotesi (2.a), "Ogni Zi proviene dalla stessa popolazione continua", è l'idea che entrambi i campioni vengano da popolazioni con uguale varianza - questo si rivela estremamente importante, praticamente parlando. Se hai dubbi sulla diversa varianza nelle tue popolazioni (da cui attingi i campioni), dovresti preoccuparti di usare WMW.