Esiste una versione semplice del test di equivalenza del test di Kolmogorov – Smirnov?


13

Sono stati previsti due test unilaterali per l'equivalenza (TOST) per il test di Kolmogorov – Smirnov per verificare l'ipotesi nulla negativista secondo cui due distribuzioni differiscono di almeno un livello specificato dal ricercatore?

Se non TOST, allora qualche altra forma di test di equivalenza?

Nick Stauner sottolinea saggiamente che (dovrei già sapere;) che esistono altri test di equivalenza TOST non parametrici per ipotesi nulle per l'equivalenza stocastica e, con ipotesi più restrittive, per l'equivalenza mediana.


Risposte:


9

Ok, ecco il mio primo tentativo. Esame attento e commenti apprezzati!

Le ipotesi a due campioni
Se riusciamo a inquadrare test di ipotesi su Kolmogorov-Smirnov su un lato , con ipotesi nulle e alternative lungo queste linee:

H 0F Y ( t )F X ( t ) e0FY(t)FX(t)

H AF Y ( t ) < F X ( t ) , per almeno una t , dove:AFY(t)<FX(t)t

  • la statistica del test corrisponde a H 0F Y ( t )F X ( t ) ;D=|mint(FY(t)FX(t))|0FY(t)FX(t)

  • la statistica del test corrisponde a H 0F Y ( t )F X ( t ) ; eD+=|maxt(FY(t)FX(t))|0FY(t)FX(t)

  • e F X ( t ) sono iCDF empiricidei campioni Y e X ,FY(t)FX(t)YX

allora dovrebbe essere ragionevole creare un'ipotesi di intervallo generale per un test di equivalenza lungo queste linee (supponendo che l'intervallo di equivalenza sia simmetrico per il momento):

H - 0| F Y ( t ) e0|FY(t)FX(t)|Δ

H - A| F Y ( t ) - F, per almeno unat.A|FY(t)FX(t)|<Δt

Ciò si tradurrebbe in due ipotesi nulle "negativiste" specifiche per verificare l'equivalenza (queste due ipotesi assumono la stessa forma, dal momento che sia che D - sono rigorosamente non negative):D+D

H -, oppure01D+Δ

H -.02DΔ

Rifiutare sia H - 01 che H - 02 porterebbe a concludere che - Δ < F Y ( t ) - F X ( t ) < Δ . Naturalmente, l'intervallo di equivalenza non deve essere simmetrico e - Δ e Δ01 02Δ<FY(t)FX(t)<ΔΔΔ potrebbero essere sostituiti con (inferiore) e Δ 1 (superiore) per le rispettive ipotesi null unilaterali.Δ2Δ1

Le statistiche del test (aggiornate: Delta è al di fuori del segno del valore assoluto)
Le statistiche del test e D - 2 (lasciando impliciti n Y e n X ) corrispondono rispettivamente a H - 01 e H - 02 e sono:D1+D2nYnX0102

, eD1+=ΔD+=Δ|maxt[(FY(t)FX(t))]|

D2=ΔD=Δ|mint[(FY(t)FX(t))]|

Soglia di equivalenza / rilevanza
L'intervallo —o [ Δ 2 , Δ 1 ] , se si utilizza un intervallo di equivalenza asimmetrico — è espresso in unità di D + e D - o l'entità delle probabilità differenziali. Quando n Y e n X si avvicinano all'infinito, il CDF di D + o D - per n Y , n X si avvicina a 0 per t[Δ,Δ][Δ2,Δ1]D+DnYnXD+DnY,nX0 e per t 0 :t<0t0

limnY,nXp+=P(nYnXnY+nXD+t)=1e2t2

CDF of $D^{+}$ (or $D^{-}$)

Quindi mi sembra che il PDF per scala del campione (o D - in scala del campione ) deve essere 0 per t < 0 e per t 0 :D+D0t<0t0

f(t)=1e2t2ddt=4te2t2

PDF of $D^{+}$ (or $D^{-}$)

Glen_b points out that this is a Rayleigh distribution with σ=12. So the large sample quantile function for sample size-scaled D+ and D is:

CDF1=Q(p)=ln(1p)2

and a liberal choice of Δ might be the critical value Qα+σ/2=Qα+14, and a more strict choice the critical value Qα+σ/4=Qα+18.


1
In the line where you pass from the cdf to the pdf, I think you got that wrong. Let KnY,nX=nYnXnY+nXD+, so (abusing notation), in the limit P(K,t)=1e2t2. Then fK(t)=ddt1e2t2=4te2t2 (note the t after the 4). (note also a missing sign in the exponent in the line above the taking of the derivative. Also I'm not sure why you have an integral symbol there, but maybe I misunderstood something.)
Glen_b -Reinstate Monica

2
@stochazesthai D1 and D2 are two one-sided test statistics. Per TOST you need to reject both the null hypotheses to which these test statistics apply. Qα is a critical value from CDF1 on the above line, and where you want to sub in 1α for p (e.g. Qα=ln(1(1α))2). The choice of Δ depends on how far past Qα (the critical rejection value for a plain old positivist H0) you need to go, before you conclude relevant difference (e.g. liberal 'equivalence' is 14 σ beyond Qα).
Alexis

2
@stochazesthai (Continuing) So if both D1Δ and D2Δ, then you reject H0.
Alexis

2
@stochazesthai Whoops! I should have put the quotes around the word liberal rather than equivalence two comments back. :)
Alexis

2
@stochazesthai If D1Δ, then reject H01, if D1<Δ, then fail to reject H01. If D2Δ, then reject H02, if D2<Δ, then fail to reject H02. If reject both H01 and H02, then reject H0, otherwise fail to reject H0.
Alexis

6

An alternative to TOST in equivalence testing is based on the confidence interval approach:

Let Δ denote the prespecified equivalence margin and

θ:=supt|FX(t)FY(t)|
the Kolmogorov-Smirnov distance between the unknown underlying distribution functions.

Now, if a 90% confidence interval for θ is completely within [Δ,Δ], then we may be 95% certain that θ is enough close to 0 to speak of "equivalence".

Without knowing the underlying distributions, it seems to be hopeless to derive an approximate analytic confidence interval, so we might need to rely on (bias corrected) bootstrap confidence intervals based on resampling from pairs X and Y. (I don't want to find conditions for their validity in this particular application though...)


Excellent. Do you have a citation for anyone undertaking the CI of Dn1,n2 (bootstrap or otherwise)?
Alexis

1
Good point... The short paper tomswebpage.net/images/K-S_test.doc mentions the "Handbook of Parametric and Nonparametric Statistical Procedures, Fifth Edition by David J.Sheskin (Apr 27, 2011)." to offer a two-sample case construcion for D. But at the moment, I don't have access to this book.
Michael M
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.