Earth Mover's Distance (EMD) tra due gaussiani


26

Esiste una formula in forma chiusa per (o una sorta di limite) dell'EMD tra x1N(μ1,Σ1) e x2N(μ2,Σ2) ?


2
Secondo en.wikipedia.org/wiki/Earth_mover%27s_distance l'EMD è uguale alla distanza di Mallows o Wasserstein, quindi puoi provare a cercarlo su Google.
kjetil b halvorsen,

2
Questo documento potrebbe essere utile: vldb.org/pvldb/vol5/p205_brianeruttenberg_vldb2012.pdf
jojer

Risposte:


27

La distanza del movimento terra può essere scritta come , in cui l'infimo viene preso su tutte le distribuzioni congiunte di X e Y i marginali X \ sim P , Y \ Q sim . Questa è anche conosciuta come la prima distanza di Wasserstein , che è W_p = \ inf \ left (\ E \ lVert X - Y \ rVert ^ p \ right) ^ {1 / p} con lo stesso infimo.EMD(P,Q)=infEXYXYXPYQWp=inf(EXYp)1/p

Sia XP=N(μx,Σx) , YQ=N(μy,Σy) .

EXYE(XY)=μxμy,
inferiore: dalla disuguaglianza di Jensen, poiché le norme sono convesse, \ E \ lVert X - Y \ rVert \ ge \ lVert \ E (X - Y) \ rVert = \ lVert \ mu_x - \ mu_y \ rVert, quindi l'EMD è sempre almeno la distanza tra i mezzi (per eventuali distribuzioni).

W2 superiore basato su W_2 : di nuovo dalla disuguaglianza di Jensen, (EXY)2EXY2 . Quindi W1W2 . Ma Dowson e Landau (1982) stabiliscono che

W2(P,Q)2=μxμy2+tr(Σx+Σy2(ΣxΣy)1/2),
dando un limite superiore a EMD=W1 .

Un limite superiore più stretto: considera l'accoppiamento Questa è la mappa derivata da Knott e Smith (1984) , Sulla mappatura ottimale delle distribuzioni , Journal of Optimization Theory and Applications, 43 (1) pp 39-49 come mappatura ottimale per ; vedi anche questo post sul blog . Si noti che e

XN(μx,Σx)Y=μy+Σx12(Σx12ΣyΣx12)12Σx12A(Xμx).
W2A=AT E YW2A=AT
EY=μy+A(EXμx)=μyVarY=AΣxAT=Σx12(Σx12ΣyΣx12)12Σx12ΣxΣx12(Σx12ΣyΣx12)12Σx12=Σx12(Σx12ΣyΣx12)Σx12=Σy,
modo che l'accoppiamento sia valido.

La distanza è quindi , dove ora che è normale con XYD

D=XY=XμyA(Xμx)=(IA)Xμy+Aμx,
ED=μxμyVarD=(IA)Σx(IA)T=Σx+AΣxAAΣxΣxA=Σx+ΣyΣx12(Σx12ΣyΣx12)12Σx12Σx12(Σx12ΣyΣx12)12Σx12.

Pertanto un limite superiore per è . Sfortunatamente, una forma chiusa per questa aspettativa è sorprendentemente spiacevole da scrivere per le normali multivariate generali: vedi questa domanda , così come questa .W1(P,Q)ED

Se la varianza di finisce per essere sferica (ad esempio se , , allora la varianza di diventa ), la prima domanda fornisce la risposta in termini di un polinomio di Laguerre generalizzato.DΣx=σx2IΣy=σy2ID(σxσy)2I

In generale, abbiamo un limite superiore semplice per basato sulla disuguaglianza di Jensen, derivata ad esempio in quella prima domanda: ED

(ED)2ED2=μxμy2+tr(Σx+ΣyAΣxΣxA)=μxμy2+tr(Σx)+tr(Σy)2tr(Σx12(Σx12ΣyΣx12)12Σx12)=μxμy2+tr(Σx)+tr(Σy)2tr((Σx12ΣyΣx12)12)=W2(P,Q)2.
L'uguaglianza alla fine è perché le matrici e sono simili , quindi hanno gli stessi autovalori e quindi le loro radici quadrate hanno la stessa traccia.ΣxΣyΣx12ΣyΣx12=Σx12(ΣxΣy)Σx12

Questa disuguaglianza è rigorosa fintanto che non è degenerato, come nella maggior parte dei casi quando .DΣxΣy

Una congettura : forse questo limite superiore più vicino, , è stretto. Poi di nuovo, ho avuto un limite superiore diverso qui per molto tempo che ho ipotizzato essere stretto che era in realtà più sciolto di quello , quindi forse non dovresti fidarti troppo di questa congettura. :)EDW2

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.