Chiarimento nella geometria dell'informazione


10

Questa domanda riguarda il documento Geometria differenziale delle famiglie esponenziali curve: curvature e perdita di informazioni di Amari.

Il testo è il seguente.

Sia una varietà n- dimensionale di distribuzioni di probabilità con un sistema di coordinate θ = ( θ 1 , , θ n ) , dove p θ ( x ) > 0 è assunto ...Sn={pθ}nθ=(θ1,,θn)pθ(x)>0

Possiamo considerare ogni punto di S n come un log delle funzioni p θ ( x ) di x ...θSnlogpθ(x)x

Sia lo spazio tangente di S n in θ , che è, approssimativamente parlando, identificato con una versione linearizzata di un piccolo quartiere di θ in S n . Sia e i ( θ ) , i = 1 , ... , n la base naturale di T θ associata al sistema coordinato ...TθSnθθSnei(θ),i=1,,nTθ

Poiché ogni punto di S n reca un registro delle funzioni p θ ( x ) di x , è naturale considerare e i ( θ ) in θ come rappresentante la funzione e i ( θ ) = θSnlogpθ(x)xei(θ)θ

ei(θ)=θilogpθ(x).

Non capisco l'ultima affermazione. Questo appare nella sezione 2 del documento sopra citato. In che modo la base dello spazio tangente è data dall'equazione sopra? Sarebbe utile se qualcuno in questa comunità che abbia familiarità con questo tipo di materiale può aiutarmi a capirlo. Grazie.


Aggiornamento 1:

Anche se sono d'accordo (da @aginensky) se sono linearmente indipendenti quindiθipθsono linearmente indipendenti, come queste sono membri dello spazio tangente in primo luogo non è molto chiaro. Quindi, come puòθilogpθessere considerato come base per lo spazio tangente. Qualsiasi aiuto è apprezzato.θilogpθ

Aggiornamento 2:

@aginensky: nel suo libro Amari afferma quanto segue:

Consideriamo il caso in cui , l'insieme di tutte le misure di probabilità (rigorosamente) positive su X = { x 0 , ... , x n } , in cui consideriamo P ( X ) come un sottoinsieme di R X = { X | X : XR } . In effetti, P ( X ) è un sottoinsieme aperto dello spazio affine { X | xSn=P(X)X={x0,,xn}P(X)RX={X|X:XR}P(X) .{X|xX(x)=1}

Quindi lo spazio tangente di S n in ogni punto può essere naturalmente identificato con il sottospazio lineare A 0 = { X | x X ( x ) = 0 } . Per la base naturale Tp(Sn)SnA0={X|xX(x)=0} di un sistema coordianteθ=(θ1,,θn), abbiamo(θiθ=(θ1,,θn).(θi)θ=θipθ

Quindi, prendiamo un altro incorporamento e identifichiamo S n con il log del sottoinsieme S n : = { log p | p S n } di R X . Un vettore tangente X T p ( S n ) viene quindi rappresentato dal risultato dell'operazione da X a p log p , che denotiamo con X ( e ) . In particolare abbiamoplogpSnlogSn:={logp|pSn}RXXTp(Sn)XplogpX(e). È ovvio cheX(e)=X(x)/p(x)e che T ( e ) p (Sn)={X(e)| XTp(Sn)}={ARX| xA(x(θi)θ(e)=θilogpθX(e)=X(x)/p(x)

Tp(e)(Sn)={X(e)|XTp(Sn)}={ARX|xA(x)p(x)=0}.

La mia domanda: se entrambi e(θisono base per lo spazio tangente allora sarebbe questo non toglie cheTpeT ( e ) p sono distinti e(θi)(e)TpTp(e) ?θi(e)Tp(e)

Sn,Tp(logSn,Tp(e))


ei(θ)=θilogpθ(x)θiθipθ

Ho provato a modificare il mio commento per chiarezza e non mi è stato permesso. Fammi sapere se vuoi maggiori dettagli.
Meh,

θilogpθ(x)=1/pθ(x)θipθ(x)

{dθi}{θi}

dθpθ

Risposte:


2

I miei commenti sono così lunghi, li sto inserendo come risposta.

RnRnRnRnRn

SnθipθSnppθiRnpθp

{1,2,3}{a,b,c}R+R>0e considera cos'è la mappa su spazi tangenti. Finalmente capisco la tua domanda? Un avvertimento è in ordine, vale a dire che la geometria differenziale non è la mia principale area di competenza. Penso di aver capito bene, ma sentiti libero di criticare o ancora mettere in discussione questa risposta.


f

p

G=[gi,j]gi,j=xipθ(x) jlogpθ(x)jlogpθ
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.