Esiste un'alternativa al test di Kolmogorov-Smirnov per i dati collegati con correzione?


14

Ho un sacco di dati da due campioni (controllo e trattati), ciascuno contenente diverse migliaia di valori che devono essere sottoposti a test di significatività in R. Teoricamente, i valori dovrebbero essere continui, ma a causa degli arrotondamenti effettuati dal software di misurazione non sono " e hanno dei legami. Le distribuzioni sono sconosciute e le forme di controllo e le distribuzioni trattate potrebbero essere diverse, quindi mi piacerebbe usare un test non parametrico per confrontare se la differenza tra i campioni è significativa per 10 diversi fattori.

Ho pensato di usare il test Kolmogorov-Smirnov, ma non è davvero adatto per i legami. Di recente mi sono imbattuto in una nuova libreria R chiamata Matching che esegue una versione bootstrap del test KS e tollera i legami. Ora è davvero una buona idea o dovrei usare un altro test invece? E devo regolare il valore p?


L'articolo collegato tratta della corrispondenza del punteggio di propensione. Può darsi che il test bootstrap abbia più generalità ma non ne sono sicuro.
Michael R. Chernick,

Avrei realizzato una versione randomizzata di qualcosa come Kolmogorov-Smirnov (beh, in realtà, probabilmente avrei usato Anderson-Darling o Cramer-von Mises per KS, ma comunque con la distribuzione randomizzata per occuparmene di legami).
Glen_b -Restate Monica

Risposte:


13

Invece di usare il test KS potresti semplicemente usare una procedura di permutazione o ricampionamento come implementato nella oneway_testfunzione del coinpacchetto. Dai un'occhiata alla risposta accettata a questa domanda .

Aggiornamento : il mio pacchetto afexcontiene la funzione che compare.2.vectorsimplementa una permutazione e altri test per due vettori. Puoi ottenerlo da CRAN:

install.packages("afex")

Per due vettori xe y(attualmente) restituisce qualcosa del tipo:

> compare.2.vectors(x,y)
$parametric
   test test.statistic test.value test.df       p
1     t              t     -1.861   18.00 0.07919
2 Welch              t     -1.861   17.78 0.07939

$nonparametric
             test test.statistic test.value test.df       p
1 stats::Wilcoxon              W     25.500      NA 0.06933
2     permutation              Z     -1.751      NA 0.08154
3  coin::Wilcoxon              Z     -1.854      NA 0.06487
4          median              Z      1.744      NA 0.17867

Qualsiasi commento su questa funzione è molto apprezzato.


3
(+1) Una descrizione di questo e di altri test è disponibile in questo blog

@Henrik Grazie per il suggerimento e per aver indicato l'altra domanda. È davvero utile!
AnjaM,

@AnjaM Prego. Potresti anche voler controllare il mio aggiornamento.
Henrik,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.