Limiti di coda sulla norma euclidea per distribuzione uniforme su


11

Ciò che sono noti limiti superiori su quanto spesso la norma euclidea di un elemento scelto uniformemente {n, (n1), ..., n1, n}d sarà maggiore di una determinata soglia?

Sono principalmente interessato ai limiti che convergono esponenzialmente a zero quando n è molto inferiore a d .


È facile rispondere a soglie tn stai solo calcolando i volumi di ipersferi - ma è più difficile stabilire per t>n . Sei in una di quelle situazioni?
whuber

3
avrei bisogno t>n.
Ricky Demer,

1
Non ho tempo di pubblicare una risposta dettagliata al momento, ma nel frattempo ecco un suggerimento: confronta con una variabile casuale binomiale con la stessa media impiegando la tecnica standard associata a Chernoff. Ciò produrrà un limite della forma a d e - b t 2 per a e b appropriati forniti t > n k(Xk/n)2adebt2ab che ha senso quando si pensa a quale sia la media della distanza euclidea quadrata. Spero che questo aiuti alcuni. t>nd(n+1)/3n
cardinale il

Risposte:


1

Intuitivamente, dovrebbe essere ovvio che un punto le cui coordinate sono campionate a caso dalla distribuzione uniforme dovrebbe avere un piccolo modulo a causa della maledizione della dimensionalità. All'aumentare di , la probabilità che un punto campionato a caso dal volume della sfera dell'unità d- dimensionale abbia una distanza inferiore o uguale a ϵ dal centro è ϵ d , che scende esponenzialmente velocemente.ddϵϵd

Darò la versione completa della soluzione del cardinale.

Sia una copia indipendente di una distribuzione discreta e uniforme sugli interi - n k n . Chiaramente, E [ X ] = 0 , e si calcola facilmente che Var ( X i ) = n ( n + 1 )XinknE[X]=0Var(Xi)=n(n+1)3

Ricordiamo che e che Var ( X 2 i ) = E [ X 4 i ] - E [ X 2 i ] 2E[Xi2]=Var(Xi)+E[Xi]2Var(Xi2)=E[Xi4]E[Xi2]2

Pertanto, E[Xi2]=Var(Xi)=n(n+1)3

Var(Xi2)=E[Xi4]E[Xi2]2=n(n+1)(3n2+3n+1)15(n(n+1)3)2

calcoloE[Xio4]

Sia Yio=Xio2

i=1dYi=(Distance of Randomly Sampled Point to Origin)2

Lo finirò domani, ma puoi vedere che questa variabile ha una media di circa , mentre meno dellafrazione2-ddi punti ha distanze inferiori alla metà della distanza massimadn2n232ddn22


0

Se tutto seguono uniformi discrete indipendenti oltre [ - n , n ] , allora come ci sono 2 n + 1 valori tra cui scegliere e la loro media è 0, abbiamo per tutti i :Xi[n,n]2n+1i

eE(Xi)=0

V(Xi)=E((Xio-E(Xio))2)=E(Xio2)=(2n+1)2-112=n(n+1)3

Quindi se è la norma euclidea quadrata di vettore ( X 1 , X 2 , . . . X d ) , e per l'indipendenza del X i :S(X1,X2,...Xd)Xio

S=Σio=1dXio2

E(S)=i=1dE(Xi2)=dn(n+1)3

Da qui in poi potresti usare la disuguaglianza di Markov: a>0,P(Sa)1aE(S)

P(Sa)dan(n+1)3

Questo limite aumenta con , il che è normale perché quando d diventa più grande la norma euclidea diventa più grande rispetto a una soglia fissa a .dda

Ora se definisci come una norma quadrata "normalizzata" (che ha lo stesso valore atteso, non importa quanto grande d ) ottieni:Sd

S=1dY=1di=1dXi2

E(S)=n(n+1)3

P(Sa)n(n+1)3a

Almeno questo limite non aumenta con , ma è ancora lungi dal risolvere la tua ricerca di un limite esponenzialmente decrescente! Mi chiedo se ciò possa essere dovuto alla debolezza della disuguaglianza di Markov ...d

Penso che dovresti chiarire la tua domanda, perché come affermato sopra la norma euclidea media dei tuoi vettori aumenta linearmente in , quindi è molto improbabile trovare un limite superiore per P ( S > a ) che sta diminuendo in d con una soglia fissa a .dP(S>a)da

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.