Utilizzo di variabili multivariate distribuite omogeneamente
Taeke fornisce un collegamento a un articolo che il testo seguente rende più intuitivo spiegando in particolare i casi a 2 e 1 norma.
∥x∥2≤r
direzione del campione
È possibile utilizzare questo risultato http://mathworld.wolfram.com/HyperspherePointPicking.html
Un multivariata gaussiana distribuito variabile (con matrice identità di covarianza) dipende solo dalla distanza, o somma dei quadrati.X
f(X1,X2,...,Xn)=∏1≤i≤n12π−−√e12x2i=12π−−√e12∑1≤i≤nx2i
Pertanto è distribuito uniformemente sulla superficie dell'ipersfera n-dimensionale.X∥X∥2
distanza del campione
Per completare devi solo campionare la distanza, per cambiare la distribuzione omogenea sulla sfera in una distribuzione omogenea in una palla. (che è più o meno simile all'esempio collegato per la selezione del punto del disco)
Se campionassi semplicemente come una distribuzione uniforme, avresti una densità relativamente più alta vicino al centro (il volume si ridimensiona come quindi una frazione dei punti finirebbe in un volume , che è più denso vicino al centro e non significherebbe una distribuzione uniforme)rrnrrn
Se invece usi l' -esima radice di una variabile campionata da una distribuzione uniforme, otterrai una distribuzione uniforme.n
1 norma∥x∥1≤r
direzione
In questo caso, campionate dalla distribuzione di Laplace invece della distribuzione gaussiana e dividete per la 1-norma. Il è distribuito uniformemente sulla sfera 1 norma n-dimensionale.XX|X|1
Non ho prove formali, solo intuizione
(poiché il pdf è indipendente dalla posizione, ci si aspetta che qualsiasi area / volume infinitesimale con la stessa 1-norma abbia la stessa probabilità e quando lo comprimi sulla superficie dell'unità la stessa )f ( x ) d Af(x)dVf(x)dA
ma test con simulazioni sembra buono.
library(rmutil)
x <- abs(rlaplace(20000))
y <- abs(rlaplace(20000))
z <- abs(rlaplace(20000))
rn <- abs(x)+abs(y)+abs(z)
xi <- (x/rn)
yi <- (y/rn)
zi <- (z/rn)
plot(sqrt(0.5)*(xi-yi),
sqrt((0.5-0.5*(xi+yi))^2+zi^2),
pc=21,bg=rgb(0,0,0,0.02), col=rgb(0,0,0,0),cex=1)
distanza
La distanza è simile a quella del caso a 2 norme (il volume si ridimensiona ancora come ).rn
p-norm∥x∥p≤r
In questo caso, se si desidera seguire lo stesso principio, è necessario campionare le distribuzioni con (ipotizzo). Queste sono distribuzioni normali generalizzate e probabilmente si riferiscono alla distribuzione menzionata da Taeke. G ( )f(x)∝e|x|pG()