È possibile applicare la divergenza KL tra distribuzione discreta e continua?


12

Non sono un matematico. Ho cercato su Internet KL Divergence. Quello che ho imparato è che la divergenza di KL misura le informazioni perse quando approssimiamo la distribuzione di un modello rispetto alla distribuzione di input. Ho visto questi tra due distribuzioni continue o discrete. Possiamo farlo tra continuo e discreto o viceversa?


Risposte:


4

No: la divergenza KL è definita solo sulle distribuzioni su uno spazio comune. Chiede della densità di probabilità di un punto in due diverse distribuzioni, p ( x ) e q ( x ) . Se p è una distribuzione su R 3 e q una distribuzione su Z , allora q ( x ) non ha senso per i punti p R 3 e p ( z ) non ha senso per i punti z Zxp(x)q(x)pR3qZq(x)pR3p(z)zZ. In effetti, non possiamo nemmeno farlo per due distribuzioni continue su spazi di dimensioni diverse (o discreti, o comunque in cui gli spazi di probabilità sottostanti non corrispondono).

Se hai in mente un caso particolare, potrebbe essere possibile trovare una misura di dissimilarità simile tra le distribuzioni. Ad esempio, potrebbe avere senso codificare una distribuzione continua sotto un codice per un codice discreto (ovviamente con informazioni perse), ad esempio arrotondando al punto più vicino nel caso discreto.


Si noti che la divergenza KL tra distribuzioni discrete e assolutamente continue è ben definita.
Olivier,

@Olivier La solita definizione richiede una misura dominante comune, no?
Dougal,

1
Hai ragione quando P e Q sono definiti su spazi diversi. Ma su uno spazio misurabile comune, esiste sempre una misura del genere (ad esempio P + Q) e la divergenza di KL non dipende dalla particolare scelta della misura dominante.
Olivier,

8

Sì, la divergenza KL tra variabili casuali continue e discrete è ben definita. Se e Q sono distribuzioni su un certo spazio X , allora sia P che Q hanno densità f , g rispetto a μ = P + Q e D K L ( P , Q ) = X f log fPQXPQfgμ=P+Q

DKL(P,Q)=Xflogfgdμ.

X=[0,1]PQ=δ00f(x)=11x=0g(x)=1x=0

DKL(P,Q)=.

Xflogfgdμ

Teorema del cambiamento di misura.
Olivier,

1

Non in generale La divergenza KL è

DKL(P || Q)=Xlog(dPdQ)dP

PQPQσdPdQ

σ

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.