Un contrario alla disuguaglianza di Fano?


10

La disuguaglianza di Fano può essere dichiarata in molte forme e una particolarmente utile è dovuta (con una piccola modifica) a Oded Regev :

Sia X una variabile casuale e sia Y=g(X) dove g() è un processo casuale. Supponi l'esistenza di una procedura f che dato y=g(X) può ricostruire X con probabilità p . Quindi

io(X;Y)pH(X)-H(p)

In altre parole, se posso ricostruire, ci sono molte informazioni reciproche nel sistema.

Esiste una "conversione" alla disuguaglianza di Fano: qualcosa della forma

"Dato un canale con sufficienti informazioni reciproche, esiste una procedura per ricostruire l'input dall'output con un errore che dipende dall'informazione reciproca"

Sarebbe troppo aspettarsi che anche questa procedura sia efficace, ma sarebbe anche interessante vedere esempi (naturali) in cui la ricostruzione esiste ma deve essere inefficiente.

Risposte:


12

Considera la seguente procedura di ricostruzione : dato y , l'output x tale che Pr [ X = x Y = y ] è massimizzato. La probabilità che questa procedura abbia esito positivo è max x Pr [ x Y = y ] . Questo è anche 2 - H ( X | Y = y ) , dove H ( X YP(y)yxPr[X=xY=y]maxxPr[xY=y]2H(X|Y=y) è l'entropia mindella variabile casuale X condizionata su Y = y . Sappiamo che H ( X ) H 1 ( X ) , dove H 1 ( X ) è l'entropia standard di Shannon della variabile casuale X . Ora non ci resta che limite superiore H ( X | Y = y ) in termini di informazione reciproca I ( X : YH(XY=y)XY=yH(X)H1(X)H1(X)XH(X|Y=y) .io(X:Y)

Scrivi . Usando la disuguaglianza di cui sopra, I ( X : Y ) H ( X ) - E y [ H ( X io(X:Y)=H(X)-H(X|Y)=H(X)-Ey[H(X|Y=y)] o E y [ H ( X Y = y ) ] H ( X ) - I ( X : Y ) .io(X:Y)H(X)-Ey[H(X|Y=y)]Ey[H(X|Y=y)]H(X)-io(X:Y)

La probabilità che la procedura abbia successo quando e Y sono scelti a caso è E y [ 2 - H ( X Y = y ) ] , che per concavità è almeno 2 - E y [ H ( X Y = y ) ] . Pertanto la probabilità che la procedura abbia esito positivo è almeno 2 I ( X : Y ) - H ( X )XYEy[2-H(X|Y=y)]2-Ey[H(X|Y=y)]2io(X:Y)-H(X).

Questa procedura è ottimale: data qualsiasi procedura di casualità , la probabilità di successo è E y [ x Pr ( X = x Y = y ) Pr ( P ( y ) = x ) ] , che è massimizzato punto-punto quando P ( y ) produce in modo deterministico l' x più probabile .PEy[xPr(X=xY=y)Pr(P(y)=x)]P(y)x


1
Quindi, c'è un'affermazione quantitativa che è un contrario della disuguaglianza di Fano che segue da questo argomento?
gnocco di mobius il

Cosa intendi per quantitativo? L'argomento che ho esposto sopra dovrebbe dire: "Dato un canale con informazioni reciproche , esiste una procedura di ricostruzione con errore al massimo 1 - 2 I ( X : Y ) - H ( X ) ". I(X:Y)12I(X:Y)H(X)
Henry Yuen,

2

Bella risposta e prova. Quindi, il limite nella tua risposta può anche essere riscritto poiché I ( X ; Y ) = H ( X ) - H ( X | Y ) per definizione. Questo è apparso in IEEE ISIT 1994, in un discorso di Baumer, per quanto ne so.

perr12I(X;Y)H(X)=12H(X|Y),(1)
I(X;Y)=H(X)H(X|Y)

Allo stesso modo, si può ottenere dove H α ( Z ) = 1

perr1-ΣyYPY(y)2-H2(X|Y),(2)
è l'entropia Renyi dell'ordineα(0,1)(1,). Qui,α=2,quindi il limite (2) è più stretto di (1).
Hα(Z)=11-α(ΣzZPZ(z)α)
α(0,1)(1,).α=2,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.