In questo post , puoi leggere la dichiarazione:
I modelli sono generalmente rappresentati da punti su una varietà dimensionale finita.
Su Geometria differenziale e Statistica di Michael K Murray e John W Rice questi concetti sono spiegati in prosa leggibili anche ignorando le espressioni matematiche. Sfortunatamente, ci sono pochissime illustrazioni. Lo stesso vale per questo post su MathOverflow.
Voglio chiedere aiuto con una rappresentazione visiva che funga da mappa o motivazione per una comprensione più formale dell'argomento.
Quali sono i punti sul collettore? Questa citazione di questo ritrovamento online indica apparentemente che possono essere i punti dati o i parametri di distribuzione:
Le statistiche sulle varietà e sulla geometria dell'informazione sono due modi diversi in cui la geometria differenziale incontra le statistiche. Mentre nelle statistiche sulle varietà, sono i dati che si trovano su una varietà, nella geometria dell'informazione i dati sono in , ma la famiglia parametrizzata di funzioni di densità di probabilità di interesse viene trattata come una varietà. Tali varietà sono note come varietà statistiche.
Ho disegnato questo diagramma ispirato da questa spiegazione dello spazio tangente qui :
[ Modifica per riflettere il commento qui sotto su : ] Su una varietà, , lo spazio tangente è l'insieme di tutte le possibili derivate ("velocità") in un punto p ∈ M associato ad ogni possibile curva ( ψ : R → M ) sul collettore che scorre attraverso p . Questo può essere visto come un insieme di mappe da ogni curva che attraversa p , ovvero C ∞ ( t ) → R , definita come composizione ( f, conψ cheindica una curva (funzione dalla linea reale alla superficie del collettore M ) che attraversa il puntop,e raffigurata in rosso sul diagramma sopra; ef,che rappresenta una funzione di test. Lelinee di contorno bianche"iso-f" si mappano sullo stesso punto sulla linea reale e circondano il puntop.
L'equivalenza (o una delle equivalenze applicate alle statistiche) è discussa qui e verrebbe correlata alla seguente citazione :
Se lo spazio dei parametri per una famiglia esponenziale contiene un set aperto dimensionale , viene chiamato rango completo.
Una famiglia esponenziale che non è full rank viene generalmente chiamata famiglia esponenziale curva, poiché in genere lo spazio dei parametri è una curva in di dimensione inferiore a s .
Questo sembra rendere l'interpretazione della trama come segue: i parametri distributivi (in questo caso delle famiglie di distribuzioni esponenziali) si trovano sul molteplice. I punti dati in verrebbero mappati su una linea sul collettore attraverso la funzione ψ : R → M nel caso di un problema di ottimizzazione non lineare carente del rango. Ciò equivarrebbe al calcolo della velocità in fisica: ricerca della derivata della funzione f lungo il gradiente delle linee "iso-f" (derivata direzionale in arancione): ( f ∘ ψ ) ′ ( t ) . La funzione f : M avrebbe il ruolo di ottimizzare la selezione di un parametro distributivo mentre la curva ψ si sposta lungo le linee di contorno di f sul collettore.
FONDO AGGIUNTO DI FONDO:
Da notare che credo che questi concetti non siano immediatamente correlati alla riduzione della dimensionalità non lineare in ML. Sembrano più simili alla geometria dell'informazione . Ecco una citazione:
Le seguenti informazioni dalle statistiche sui collettori con applicazioni per modellare le deformazioni delle forme di Oren Freifeld :
giace completamente da una parte. Gli elementi di TpM sono chiamati vettori tangenti.
[...] Su varietà, i modelli statistici sono spesso espressi in spazi tangenti.
[...]
Let e rappresentano due, forse sconosciuta, punti in . Si presume che i due set di dati soddisfino le seguenti regole statistiche:
[...]
In altre parole, quando è espresso (come vettori tangenti) nello spazio tangente (a ) in , può essere visto come un insieme di campioni iid da un gaussiano a media zero con covarianza . Allo stesso modo, quando è espresso nello spazio tangente in , può essere visto come un insieme di campioni iid da un gaussiano a media zero con covarianza . Questo generalizza il caso euclideo.
Sullo stesso riferimento, trovo l'esempio più vicino (e praticamente solo) online di questo concetto grafico di cui sto chiedendo:
Ciò indicherebbe che i dati si trovano sulla superficie del collettore espresso come vettori tangenti e che i parametri sarebbero mappati su un piano cartesiano?