Ha senso eseguire un test Kolmogorov-Smirnov a una coda?


15

È significativo e possibile eseguire un test KS a una coda? Quale sarebbe l'ipotesi nulla di tale test? O il test KS è intrinsecamente un test a due code?

Vorrei beneficiare di una risposta che mi ha aiutato a capire la distribuzione di D (sto lavorando attraverso il documento di Massey del 1951, e trovo la descrizione stimolante, ad esempio D+ e D il supremum e l'infimo delle differenze del valore non assoluto delle differenze nei CDF empirici?).

Follow domanda: come si p -Valori per D+ e D ottenuti? Molte delle pubblicazioni che sto incontrando presentano valori tabulari, piuttosto che CDF di , e D - .DnD+D

Aggiornamento: ho appena scoperto la domanda correlata Qual è l'ipotesi nulla in un test di Kolmogorov-Smirnov unilaterale? , che mi mancava nella mia scansione iniziale prima di scrivere questo.

Risposte:


20

È significativo e possibile eseguire un test KS a una coda?

Decisamente.

il test KS è intrinsecamente un test a due code?

Affatto.

Quale sarebbe l'ipotesi nulla di tale test?

Non chiarisci se stai parlando del test a un campione o dei due campioni. La mia risposta qui copre entrambi: se consideri come rappresentante del cdf della popolazione da cui è stato estratto un campione X , si tratta di due campioni, mentre ottieni un caso campione considerando F X come una distribuzione ipotizzata ( F 0FXXFXF0 , se preferisci).

In alcuni casi potresti scrivere il null come uguaglianza (ad esempio se non fosse visto come possibile per andare nell'altra direzione), ma se vuoi scrivere un null direzionale per un'alternativa a una coda, potresti scrivere qualcosa del genere :

H0:FY(t)FX(t)

H1:FY(t)<FX(t), per almeno una t

(o il suo contrario per l'altra coda, naturalmente)

Se aggiungiamo un presupposto quando usiamo il test che sono uguali o che sarà più piccolo, allora il rifiuto del nulla implica (primo ordine) ordine stocastico / dominanza stocastica del primo ordineFY . In campioni abbastanza grandi, è possibile incrociare le F, anche più volte, e rifiutare ancora il test unilaterale, quindi il presupposto è strettamente necessario per il dominio stocastico.

Liberamente se con disuguaglianza stretta per almeno qualche t allora Y 'tende ad essere più grande' di X .FY(t)FX(t)tYX

Aggiungere ipotesi come questa non è strano; è standard. Non è particolarmente diverso dall'assumere (diciamo in un ANOVA) che una differenza nei mezzi sia dovuta a uno spostamento dell'intera distribuzione (piuttosto che a un cambiamento di asimmetria, in cui parte della distribuzione si sposta verso il basso e alcuni si sposta verso l'alto, ma in tale modo in cui la media è cambiata).


Quindi consideriamo, ad esempio, uno spostamento nella media per un normale:

inserisci qui la descrizione dell'immagine

Il fatto che la distribuzione di è spostata a destra da una certa quantità da quello per X implica che F Y è inferiore F X . Il test unilaterale di Kolmogorov-Smirnov tenderà a rifiutare in questa situazione.YXFYFX

Allo stesso modo, considera uno spostamento di scala in una gamma:

inserisci qui la descrizione dell'immagine

Ancora una volta, il passaggio a una scala più ampia produce una F. inferiore. Ancora una volta, il test unilaterale di Kolmogorov-Smirnov tenderà a rifiutare in questa situazione.

Esistono numerose situazioni in cui tale test può essere utile.


Quindi cosa sono e D - ?D+D

Nel test a un campione, è la massima deviazione positiva del cdf del campione dalla curva ipotizzata (ovvero la distanza maggiore l'ECDF è superiore a F 0 , mentre D - è la massima deviazione negativa - la distanza maggiore dell'ECDF è sotto F 0 ). Sia D + che D - sono quantità positive:D+F0DF0D+D

inserisci qui la descrizione dell'immagine

D+D

H0:FY(t)F0(t)

H1:FY(t)<F0(t), per almeno una t

YFF0DFY(t)<F0(t)D


D+D

Non è una cosa semplice Sono stati utilizzati vari approcci.

Se ricordo correttamente uno dei modi in cui la distribuzione è stata ottenuta tramite l'uso dei processi del ponte browniano ( questo documento sembra supportare tale ricordo ).

Credo che questo articolo, e l'articolo di Marsaglia e altri qui trattino entrambi alcuni retroscena e forniscano algoritmi computazionali con molti riferimenti.

Tra questi, avrai un sacco di storia e vari approcci che sono stati utilizzati. Se non coprono ciò di cui hai bisogno, probabilmente dovrai porlo come una nuova domanda.

DnD+D

Non è particolarmente una sorpresa. Se ricordo bene, anche la distribuzione asintotica si ottiene come una serie (questo ricordo sarebbe sbagliato), e in campioni finiti è discreto e non in qualsiasi forma semplice. In entrambi i casi e non esiste un modo conveniente per presentare le informazioni se non come un grafico o una tabella.


2
"In campioni abbastanza grandi, è possibile incrociare le F - anche più volte, e comunque rifiutare il test unilaterale" - si noti che ciò significa che è possibile rifiutare il test unilaterale in entrambe le direzioni per gli stessi dati!
Hao Ye,

2
@HaoYe Sì, è possibile. Sarebbe una chiara indicazione che il dominio stocastico sarebbe insostenibile.
Glen_b
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.