Qual è la varianza del massimo di un campione?


13

Sto cercando limiti sulla varianza del massimo di un insieme di variabili casuali. In altre parole, sto cercando formule a forma chiusa per B , in modo che

Var(maxiXi)B,
DoveX={X1,,XM} è un insieme fisso diM variabili casuali con mezzi finitiμ1,,μM e varianzeσ12,,σM2 .

Posso dedurre che ma questo limite sembra molto lento. Un test numerico sembra indicare che B = max i σ 2 i potrebbe essere una possibilità, ma non sono stato in grado di dimostrarlo. Qualsiasi aiuto è apprezzato.

Var(maxiXi)iσi2,
B=maxiσi2

3
(Vuoi assumere la sono indipendenti?) La congettura è plausibile, ma sembra essere falsa. Ad esempio, fare alcune prove in cui X i è iid con CDF 1 - x 1 - s , 1 x , s > 3 . La varianza del loro massimo, rispetto alla loro varianza comune, aumenta senza limiti man mano che cresce M. XiXi1x1s1xs>3M
whuber

@whuber Grazie, questo spiega perché non sono stato in grado di provare quella congettura :) Sono davvero interessato al caso in cui la sia indipendente. Giusto per chiarire, sono per lo più interessato ai limiti generali che usano solo i primi due momenti. Non sono sicuro che esistano limiti generali più acuti della varianza comune.Xi
Peter,

1
Devo sottolineare che il tuo limite di somma (supponendo che sia corretto - sarebbe bello vedere uno schizzo della prova) è stretto. Ad esempio, sia supportato sull'intervallo [ - , a ] con varianze non superiori a ε 2 e sia supportato X 1 su [ a , ] . Quindi max i X i = X 1 as, con varianza σ 2 1σ 2 1X2,,XM[,a]ε2X1[a,]maxiXi=X1 , ma la disuguaglianza può essere ridotta a piacimento restringendo ε 2 . σ12σ12+(M1)ε2ε2
whuber

1
Per i dati iid, la teoria del valore estremo fornisce le classi di distribuzioni alle quali converge il massimo del campione, con determinate condizioni sulle code delle distribuzioni originali che danno diverse classi delle distribuzioni asintotiche. Quindi dubito che sarai in grado di derivare un buon limite basato solo sui due momenti, anche se ho solo una conoscenza tangenziale della teoria.
StasK,

Risposte:


9

Per ogni variabile casuale X i , il limite generale migliore è V a r ( max X i ) i V a r ( X i ) come indicato nella domanda originale. Ecco uno schizzo di prova: Se X, Y sono IID, allora E [ ( X - Y ) 2 ] = 2 V a r ( X ) . Dato un vettore di variabili eventualmente dipendenti ( X 1 , ...nXiVar(maxXi)iVar(Xi)E[(XY)2]=2Var(X) , sia ( Y 1 , ... , Y n ) un vettore indipendente con la stessa distribuzione congiunta. Per ogni r > 0 , abbiamo l'unione legata che P [ | max i X i - max i Y i | 2 > r ] i P [ | X i - Y i | 2 > r ](X1,,Xn)(Y1,,Yn)r>0P[|maxiXimaxiYi|2>r]iP[|XiYi|2>r], E integrando questo da 0 a rese la disuguaglianza rivendicato.dr0

Se sono indicatori IID di eventi di probabilità ϵ , allora max X i è un indicatore di un evento di probabilità n ϵ + O ( n 2 ϵ 2 ) . Fissando n e lasciando che ϵ tendano a zero, otteniamo V a r ( X i ) = ϵ - ϵ 2 e V a r ( max i X i ) = n ϵ +XiϵmaxXinϵ+O(n2ϵ2)nϵVar(Xi)=ϵϵ2Var(maxiXi)=nϵ+O(n2ϵ2).


3

A question on MathOverflow is related to this question.

For IID random variables, the kth highest is called an order statistic.

Xi11/1009/10 and M=10, then the maximum is 1 with probability 11/e, so the variance of the population is 0.09 while the variance of the maximum is about 0.23.

Here are two papers on the variances of order statistics:

Yang, H. (1982) "On the variances of median and some other order statistics." Bull. Inst. Math. Acad. Sinica, 10(2) pp. 197-204

Papadatos, N. (1995) "Maximum variance of order statistics." Ann. Inst. Statist. Math., 47(1) pp. 185-193

I believe the upper bound on the variance of the maximum in the second paper is Mσ2. They point out that equality can't occur, but any lower value can occur for IID Bernoulli random variables.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.