Introduzione e notazioni:
Ecco una nuova e semplice versione del mio algoritmo che sembra terminare (secondo i miei esperimenti), e ora vorrei dimostrarlo.
Lascia che la notazione riferisca a un punto dati p dimensionale (un vettore). Ho tre set A, B e C, tali che | A | = n , | B | = m , | C | = l :
A = { x i | i = 1 , . . , n } B = { x j | j = n + 1Xio∈ Rpp|A|=n|B|=m|C|=l
A={xi|i=1,..,n}
C = { x u | u = n + m + 1 , . . , n + m + l }B={xj|j=n+1,..,n+m}
C={xu|u=n+m+1,..,n+m+l}
Dato , d d A x i denota la distanza euclidea media da x i ai suoi k punti più vicini in A ; e d C x i denotano la distanza euclidea medio da x i al suo k più vicino a punti C .k∈N∗dAxixikAdCxixikC
Algoritmo:
ABBCACB
- A′={xi∈A∣dAxi>dCxi}
- A=A∖A′B=B∪A′
- B′={xi∈B∣dAxi<dCxi
- B=B∖B′A=A∪B′
- ABBA|A|≤k|B|≤k
L'algoritmo termina in due casi:
- |A||B|k
- A′=B′=∅
Domanda:
∑x∈AdCx+∑x∈BdAx∑x∈AdAx+∑x∈BdCx∑x∈AdAx+∑x∈BdBx∑x∈AdBx+∑x∈BdAx
Appunti:
- kxSkxSxk=1
- A,B,C∀xi∈B,xj∈Axb∈Cxixa∈Cxjdistance(xi,xb)<distance(xj,xa)BCA
- ABABA′B