Risposta: .Θ(mnlogn−−−−−√)
Applicando una versione multidimensionale del teorema del limite centrale, otteniamo che il vettore ha una distribuzione gaussiana asintoticamente multivariata con
e
Supponiamo di seguito che sia un vettore gaussiano (e non solo approssimativamente un vettore gaussiano). Aggiungiamo una variabile casuale gaussiana con varianza a tutti ( è indipendente da tutti ). Cioè, lascia
V a r [ X i ] = m ( 1(X1,…,Xn)Cov(Xi,Xj)=-m/n2. XZm/n2XiZXi( Y 1 Y 2 ⋮ Y n )=( X 1 +Z X 2 +Z⋮ X n +Z). (Y1
Var[Xi]=m(1n−1n2),
Cov(Xi,Xj)=−m/n2.
X Zm/n2XiZXi⎛⎝⎜⎜⎜⎜Y1Y2⋮Yn⎞⎠⎟⎟⎟⎟=⎛⎝⎜⎜⎜⎜X1+ZX2+Z⋮Xn+Z⎞⎠⎟⎟⎟⎟.
Otteniamo un vettore gaussiano . Ora ogni ha varianza :
e tutti sono indipendenti:
Y i m / n V a r [ Y i ] = V a r [ X i ] + 2 C o v ( X i , Z ) ⏟ =(Y1,…,Yn)Yim/nYiCov(Yi,Yj)=Cov(Xi,Xj)+ C o v ( X i , Z ) + C o v ( X j , Z ) ⏟ =Var[Yi]=Var[Xi]+2Cov(Xi,Z)=0+Var[Z]=m/n,
YiCov(Yi,Yj)=Cov(Xi,Xj)+Cov(Xi,Z)+Cov(Xj,Z)=0+Cov(Z,Z)=0.
Nota che . Quindi il nostro problema originale equivale al problema di trovare . Per prima cosa analizziamo per semplicità il caso quando tutti hanno varianza .Yi−Yj=Xi−XjYmax−Ysec−maxYi1
Problema. Ci viene dato gaussiano indipendente rv con mean e varianza . Stimare le aspettative di .nγ1,…,γnμ1γmax−γsec−max
Risposta: .Θ(1logn√)
Prova informale.
Ecco una soluzione informale a questo problema (non è difficile renderlo formale). Poiché la risposta non dipende dalla media, assumiamo che . Sia , dove . Abbiamo (per moderatamente grande ),
μ=0Φ¯(t)=Pr[γ>t]γ∼N(0,1)t
Φ¯(t)≈12π−−√te−12t2.
Nota che
Φ(γi) sono distribuiti in modo uniforme e indipendente su ,[0,1]
Φ(γmax) è il più piccolo tra ,Φ(γi)
Φ(γsec−max) è il secondo più piccolo tra .Φ(γi)
Quindi è vicino a e è vicino a (non c'è concentrazione ma se non t importa delle costanti queste stime sono abbastanza buone; in effetti, sono anche abbastanza buone se ci preoccupiamo delle costanti - ma questo ha bisogno di una giustificazione). Usando la formula per , otteniamo quel
Φ(γmax)1/nΦ(γmax)2/nΦ¯(t)
2≈Φ¯(γsec−max)/Φ¯(γmax)≈e12(γ2max−γ2sec−max).
Pertanto is whp Nota che . Abbiamo,
γ2max−γ2sec−maxΘ(1)γmax≈γsec−max=Θ(logn−−−−√)
γmax−γsec−max≈Θ(1)γmax+γsec−max≈Θ(1)logn−−−−√.
QED
Otteniamo che
E[Xmax−Xsec−max]=E[Ymax−Ysec−max]=Var[Yi]−−−−−−√×E[γmax−γsec−max]=Θ(mnlogn−−−−−−√).
Lo stesso argomento si manifesta quando abbiamo punteggi arbitrari. Mostra che
E[Xmax−Xsec−max]=cE[Xmax−Xmin]/logn.