Qual è il CDF a due campioni di e dal test unilaterale di Kolmogorov-Smirnov?


9

Sto cercando di capire come ottenere valori per il test unilaterale di Kolmogorov-Smirnov e sto cercando di trovare CDF per e nel caso di due campioni. Di seguito viene citato in alcuni punti come CDF per in un caso a campione:D + n 1 , n 2 D - n 1 , n 2 D + npDn1,n2+Dn1,n2Dn+

pn+(x)=P(Dn+x|H0)=xj=0n(1x)(nj)(jn+x)j1(1xjn)nj

Inoltre, se c'è una formulazione leggermente diversa di questo CDF a un campione (sto sostituendo x per t nella sua citazione per coerenza con la mia notazione qui):

Usando la trasformazione integrale di probabilità, Donald Knuth deriva la loro distribuzione (comune) a pag. 57 ed esercizio 17 del Volume 2. TAoCP Cito:

(Dn+xn)=xnnckx(nk)(kx)k(x+nk)nk1

Ciò si applicherebbe alle ipotesi unilaterali nel caso di un campione, come ad esempio: H 0F(x)F00 , dove F(x) è il CDF empirico di x e F0 è un CDF.

Io penso che la x in questo caso è il valore di Dn+ nel proprio campione, e che n(1x) è il più grande intero in nnx . (È giusto?)

Ma qual è il CDF per (o ) quando uno ha due campioni? Ad esempio, quando H per i CDF empirici di e ? Come ottenere ?Dn1,n2+Dn1,n20FA(x)FB(x)0ABpn1,n2+


1
Proprio come un puntatore per chiunque cerchi di rispondere a questa domanda - la mia risposta alla domanda precedente di Alexis (che è collegata alla domanda precedente) ha collegamenti a diversi riferimenti con alcune discussioni sulla storia, ognuna con una serie di riferimenti pertinenti. Potresti voler controllare quei documenti e il loro elenco di riferimenti.
Glen_b

@Glen_b Grazie! Apprezzo davvero la tua eccellente risposta all'altra mia domanda e ho seguito le risorse citate, ma non ho ottenuto alcuna trazione sul CDF per lì, e piuttosto che impantanare i commenti che pensavo di aprire una nuova query . Ulteriori riferimenti benvenuti, se conosci qualcuno che funzionerà per questo. D+
Alexis,

Alexis: nessuna critica era intesa dal mio commento; la tua scelta di aprire una nuova domanda era esattamente giusta (secondo me). Volevo solo salvare alle persone un po 'di legwork nel rintracciare alcuni dei riferimenti pertinenti - ho pensato che potrebbe non venire necessariamente in mente a tutti di seguire il tuo link all'altra domanda, e potrebbe non succedere alle persone che hanno fatto quei link nel mio la risposta aveva alcuni riferimenti che potrebbero voler conoscere.
Glen_b

Risposte:


6

Ok, ho intenzione di accoltellarmi. Approfondimenti critici benvenuti.

A pagina 192 Gibbons e Chakraborti (1992), citando Hodges, 1958, iniziano con un CDF a piccolo campione (esatto?) Per il test su due lati (sto scambiando la loro notazione e con e , rispettivamente):m,ndn1,n2x

P(Dn1,n2x)=1P(Dn1,n2x)=1A(n1,n2)(n1+n2n1)

Dove viene prodotto attraverso un elenco di percorsi (aumentando monotonicamente in e ) dall'origine al punto attraverso un grafico con — sostituendo con — i valori dell'asse xe dell'asse y sono e . I percorsi devono inoltre obbedire al vincolo di rimanere all'interno dei confini (dove è il valore della statistica del test di Kolmogorov-Smirnov):A(n1,n2)n1n2(n1,n2)Sm(x)Fn1(x)n1F1(x)n2F2(x)x

n2n1±(n1+n2)x(n1+n2n1)

Di seguito è illustrata la figura 3.2 che fornisce un esempio di , con 12 percorsi di questo tipo:A(3,4)

Figura 3.2 da pagina 193 di Gibbons e Chakraborti (1992) inferenza statistica non parametrica.

Gibbons e Chakaborti continuare a dire che l' unilaterale -value viene ottenuta utilizzando lo stesso metodo grafica, ma con solo il limite inferiore per , e solo la parte superiore per .pDn1,n2+Dn1,n2

Questi piccoli approcci di esempio comportano algoritmi di enumerazione del percorso e / o relazioni di ricorrenza, che rendono senza dubbio desiderabili calcoli asintotici. Gibbons e Chakraborti notano anche i CDF limitanti quando e avvicinano all'infinito, di :n1n2Dn1,n2

limn1,n2P(n1n2n1+n2Dn1,n2x)=12i=1(1)i1e2i2x2

E danno il CDF limitante di (o ) come:Dn1,n2+Dn1,n2

limn1,n2P(n1n2n1+n2Dn1,n2+x)=1e2x2

Poiché e sono rigorosamente non negativi, il CDF può assumere solo valori diversi da zero su :D+D[0,)

CDF di $ D ^ {+} $ (o $ D ^ {-} $)


Riferimenti
Gibbons, JD e Chakraborti, S. (1992). Inferenza statistica non parametrica . Marcel Decker, Inc., 3a edizione, edizione rivista e ampliata.

Hodges, JL (1958). La probabilità di significatività del test a due campioni di Smirnov. Arkiv för matematik . 3 (5): 469--486.


1
Il cdf effettivo esiste ovunque, ma per il cdf sarà zero; la forma funzionale avete dato vale solo per (questo è suscettibile di semplice ragionamento, per di ?(,0)x0P(D+<0)
Glen_b -Reinstate Monica
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.