Sia distanza dall'origine e sia V 0 [ p ] il volume dell'ipersfera dell'unità in dimensioni p . Quindi il volume contenuto in un'ipersfera di raggio r èrV0[ p ]pr
V[ r ] = V0[ p ] rp
Se lasciamo denotiamo la frazione del volume contenuto in questa ipersfera e definiamo R = r p , alloraP= V[ r ] / V0[ p ]R = rp
P[ R ] = R
Se i punti di dati sono uniformemente distribuiti all'interno della palla unitaria, poi per la formula è una funzione di distribuzione cumulativa (CDF) per R . Ciò equivale a una densità di probabilità uniforme per R nell'intervallo unitario, ovvero p [ R ] = P ′ [ R ] = 1 . Quindi, come suggerito da Mark Stone nei commenti, possiamo ridurre il caso p dimensionale a un problema 1D equivalente.0 ≤ R ≤ 1RRp [ R ] = P'[ R ] = 1p
Ora se abbiamo un singolo punto , allora per definizione di un CDF abbiamo Pr [ R ≤ ρ ] = P [ ρ ] e Pr [ R ≥ ρ ] = 1 - P [ ρ ] . Se R min è il valore più piccolo tra n punti e tutti i punti sono indipendenti, il CDF per è dato da
Pr [ R min ≥ ρ ] = Pr [ R ≥ ρ ]RPr [ R ≤ ρ ] = P[ ρ ]Pr [ R ≥ ρ ] = 1 - P[ ρ ]Rminn
(questo è un risultato standard dellateoriaunivariata delvalore estremo).
Pr [ Rmin≥ ρ ] = Pr [ R ≥ ρ ]n= ( 1 - ρ )n
Per definizione della mediana, abbiamo
che possiamo riscrivere come
(1-dp)n=1
12= Pr [ ( Rmin)m e d≥ R ] = ( 1 - R )n
che equivale al risultato desiderato.
( 1 - dp)n= 12
EDIT: Tentativo di risposta in stile " ELI5 ", in tre parti.
[ 0 , 1 ]12
nn
prrp