Perché l'efficienza relativa asintotica del test di Wilcoxon


13

È noto che l'efficienza relativa asintotica (ARE) del test di rango firmato Wilcoxon è 3π0,955rispetto altesttdi Student, se i dati sono tratti da una popolazione normalmente distribuita. Ciò vale sia per il test di base a un campione che per la variante per due campioni indipendenti (Wilcoxon-Mann-Whitney U). È anche l'ARE di un test di Kruskal-Wallis rispetto a un test ANOVAF, per dati normali.

Questo straordinario (per me, una delle " apparizioni più inaspettate di π ") e il risultato straordinariamente semplice hanno una prova perspicace, notevole o semplice?


Data la comparsa di π nel CDF normale, la comparsa di π nel non sono in realtà dovrebbe essere tutto così sorprendente. Rischio una risposta ma ci vorrà del tempo per farne una buona.
Glen_b

1
@Glen_b In effetti - ho già visto una discussione sul "perché π appare così tanto nelle statistiche" prima (anche se non ricordo se fosse su CV o meno) e "a causa della normale distribuzione" Conosco molto, ma 3/π è ancora piacevolmente sorprendente la prima volta che lo vedi. Per fare un confronto, l'ARE di Mann-Whitney contro il test t a due campioni è 3 su dati esponenziali, 1,5 su doppio esponenziale e 1 su uniforme - molto più rotondo!
Silverfish,

1
@Silverfish Ho collegato la pagina 197 di van der Vaart "Statistiche asintotiche". Per un campione, i test dei segni hanno ARE 2/π rispetto al test t.
Khashaa,

1
@Silverfish ... e alla logistica è (π/3)2 . Ci sono alcuni degli ARE ben noti (in uno o due casi campione) che coinvolgono π e parecchi che sono semplici rapporti di numeri interi.
Glen_b

1
Per un test di livello firmato da un campione, sembra essere 3/π . Per il test del segno di un campione, è 2/π . Quindi, abbiamo chiarito la nostra posizione. Penso che sia un buon segno.
Khashaa,

Risposte:


10

Breve schizzo di ARE per il test un campione t, il test firmato e il test di rango firmato

Mi aspetto che la versione lunga della risposta di @ Glen_b includa un'analisi dettagliata per il test dei ranghi firmato a due campioni insieme alla spiegazione intuitiva dell'ARE. Quindi salterò gran parte della derivazione. (caso di un campione, puoi trovare i dettagli mancanti in Lehmann TSH).

Problema di test : Sia un campione casuale dal modello di posizione f ( x - θ ) , simmetrico rispetto allo zero. Dobbiamo calcolare ARE di test firmato, test di rango firmato per l'ipotesi H 0 : θ = 0X1,...,Xnf(X-θ)H0:θ=0 rispetto al test t.

Per valutare l'efficienza relativa dei test, vengono prese in considerazione solo le alternative locali poiché i test coerenti hanno un potere tendente a 1 rispetto all'alternativa fissa. Le alternative locali che danno origine a un potere asintotico non banale hanno spesso la forma perhfisso, che viene chiamatoderiva di Pitmanin alcune pubblicazioni.θn=h/nh

Il nostro compito da svolgere è

  • trova la distribuzione limite di ciascuna statistica test sotto il valore null
  • trova la distribuzione limite di ciascuna statistica test sotto l'alternativa
  • calcolare il potere asintotico locale di ciascun test

Prova statica e asintotica

  1. t-test (data l'esistenza di ) t n = σt n =
    tn=nX¯σ^dN(0,1)under the null
    tn=nX¯σ^dN(h/σ,1)under the alternative θ=h/n
    • quindi il test che rifiuta se ha la funzione di potenza asintotica 1 - Φ ( z α - h 1tn>zα
      1Φ(zαh1σ)
  2. test firmato Sn=1ni=1n1{Xi>0}
    n(Sn12)dN(0,14)sotto il null 
    e ha potere asintotico locale 1 - Φ ( z α - 2 h f ( 0 ) )
    n(Sn-12)dN(hf(0),14)in alternativa 
    1-Φ(zα-2hf(0))
  3. Test dei ranghi W n d N ( 2 h f 2 , 1
    Wn=n-2/3Σio=1nRio1{Xio>0}dN(0,13)sotto il null 
    e ha potere asintotico locale 1 - Φ ( z α
    WndN(2hf2,13)in alternativa 
    1-Φ(zα-12hf2)

Pertanto, A R E ( W n )

UNRE(Sn)=(2f(0)σ)2
Sefè la densità normale standard,ARE(Sn)=2/π,ARE(Wn)=3/π
UNRE(Wn)=(12f2σ)2
fARE(Sn)=2/πARE(Wn)=3/π

fARE(Sn)=1/3ARE(Wn)=1/3

Commento sulla derivazione della distribuzione in alternativa

Esistono ovviamente molti modi per derivare la distribuzione limitativa in alternativa. Un approccio generale è quello di utilizzare il terzo lemma di Le Cam. Versione semplificata di esso afferma

ΔnWn

(Wn,Δn)dN[(μσ2/2),(σW2ττσ2/2)]
WndN(μ+τ,σW2)under the alternative

cov(Wn,Δn)Δn

Δnhni=1nl(Xi)12h2I0
where l is score function, I0 is information matrix. Then, for instance, for signed test Sn
cov(n(Sn1/2),Δn)=hcov(1{Xi>0},ff(Xi))=h0f=hf(0)

+1 I wasn't going to go into quite this much detail (indeed, with your answer covering things quite nicely already, I probably won't add anything to what I have now) so if you want to put more detail, don't hold back on my account. I would have been several days yet (and still for less than you have already), so it's a good thing you came in.
Glen_b -Reinstate Monica

This is a nice answer particularly for adding in Le Cam's lemma (+1). It seems to me there is quite a big jump between establishing the asymptotics in 1, 2, and 3, and the "therefore" bit where you write the AREs. I think if I were writing this up, I'd define asymptotic efficiency at this point (or maybe earlier, so the upshot of points 1, 2 and 3 would be the AEs not just local asymptotic powers in each case) and then the step to the AREs would be much easier for future readers to follow.
Silverfish

Perhaps it is worth specifying your H1? One-sided and two-sided cases have different-looking asymptotic powers (though they lead to the same AREs).
Silverfish

Feel free to edit my answer or append it to the OP.
Khashaa

1
@Khashaa Thanks. I shall edit your post when I have the right stuff in front of me. Would you mind clarifying the meaning of the in the final equation?
Silverfish

6

This has nothing to do with explaining why π appears (which was explained nicely by others) but may help intuitively. The Wilcoxon test is a t-test on the ranks of Y whereas the parametric test is computed on the raw data. The efficiency of the Wilcoxon test with respect to the t-test is the square of the correlation between the scores used for the two tests. As n the squared correlation converges to π3. You can easily see this empirically using R:

n <- 1000000; x <- qnorm((1:n)/(n+1)); cor(1:n, x)^2; 3/pi
[1] 0.9549402
[1] 0.9549297
n <- 100000000; x <- qnorm((1:n)/(n+1)); cor(1:n, x)^2; 3/pi
[1] 0.9549298
[1] 0.9549297

This is indeed a very helpful comment. Is it slightly conceptually closer to do n <- 1e6; x <- rnorm(n); cor(x, rank(x))^2 (which obviously produces the same result)?
Silverfish


something I don't understand about this answer is that the correlation is higher for lower values of n (I think the proximal reason is that we don't see the tails very well for smaller n). Naively that implies that the relative efficiency of the Wilcoxon is higher for small n, which surprises me ... ?? (I might do some simulations, but (a) if there's an easy answer ... and (b) am I missing a conceptual point somewhere?)
Ben Bolker

To my recollection the small sample efficiency of both the Wilcoxon signed rank test and the W-M-W are a bit lower than the asymptotic value on shift alternatives at the normal distribution.
Glen_b -Reinstate Monica

5

Short version: The basic reason with the Wilcoxon-Mann-Whitney under a shift alternative is that finding the asymptotic relative efficiency (WMW/t) corresponds to evaluating 12σ2[f2(x)dx]2 where f is the common density at the null and σ is the common variance.

So at the normal, f2 is effectively a scaled version of f; its integral will have a 1π term; when squared, that's the source of the π.

The same term - with the same integral - is involved in the ARE for the signed rank test, so it takes the same value.

For the sign test relative to t, the ARE is 4σ2f(0)2... and f(0)2 again has a π in it.

So essentially it's as I said in comments; π is in the ARE for the Wilcoxon-Mann-Whitney vs the two-sample t test, for the Wilcoxon signed rank test vs the one-sample t and the sign test vs the one-sample t test (in each case at the normal) quite literally because it appears in the normal density.

Reference:

J. L. Hodges and E. L. Lehmann (1956),
"The Efficiency of Some Nonparametric Competitors of the t-Test",
Ann. Math. Statist., 27:2, 324-335.


I like the explanation for the intuition for the appearance of π in the denominator; is it essentially coincidence that the Renyi entropy turns up in the WMW/Wilcoxon integrals?
Silverfish

@Silverfish That f2dx turns up is certainly not coincidence. However, that's not because that's connected to Rényi entropy, or at least I don't see any direct connection. We're getting into stuff I don't really know about now, though.
Glen_b -Reinstate Monica

@Silverfish It's only a Renyi entropy for α=2. Otherwise, it is just a plain old square that can come up in a million different ways.
abalter
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.