Il significato di rappresentare il simplex come una superficie triangolare nella distribuzione di Dirichlet?


9

Sto leggendo un libro che introduce la distribuzione di Dirchilet e poi ha presentato cifre al riguardo. Ma non ero davvero in grado di capire quelle cifre. Ho attaccato la figura qui in fondo. Quello che non capisco sono i significati dei triangoli.

Normalmente quando si vuole tracciare una funzione di 2 variabili, si prende il valore di var1 e va2 e quindi si traccia il valore del valore della funzione di quelle due variabili ... che dà una visualizzazione in una dimensione 3D. Ma qui ci sono 3 dimensioni e un altro valore per il valore della funzione in modo che esegua una visualizzazione nello spazio 4D. Non riesco a capire quelle cifre!

Spero che qualcuno possa chiarirli per favore!

MODIFICARE: ecco cosa non capisco dalla figura 2.14a. Quindi abbiamo tratto da K = 3 dirichlet un theta campione (che è fondamentalmente un vettore) che è: theta = [theta1, theta2, theta3]. Il triangolo traccia [theta1, theta2, theta3]. La distanza dall'origine a ciascun theta_i è il valore di theta_i. Quindi per ogni theta_i ha messo un vertice e ha collegato tutti e tre i vertici e ha fatto un triangolo. So che collegando [theta1, theta2, theta3] a dir (theta | a) otterrò un numero che è la probabilità congiunta del vettore theta. Comprendo anche che la probabilità di variabili casuali continue è una misura di un'area. Ma qui abbiamo 3 dimensioni, quindi la probabilità congiunta sarà la misura del volume dello spazio dal piano rosa e sotto ... cioè la piramide. Ora non capisco qual è il ruolo del triangolo qui.

inserisci qui la descrizione dell'immagine


2
Ti suggerisco di iniziare dalla distribuzione beta e di lavorare da lì. Il Dirichlet per 3 è "solo" un'estensione logica della beta, che è il Dirichlet per 2.
Andris Birkmanis,

Controlla questa discussione per un esempio: stats.stackexchange.com/questions/244917/…
Tim

Può essere utile pensare che una distribuzione Beta sia mostrata in 2D (l'asse x che rappresenta il risultato binario {0,1} e l'asse y che rappresenta la probabilità), quindi un risultato ternario necessita della dimensione extra, giusto?
George,

Risposte:


4

Non capisco qual è il ruolo del triangolo qui. Cosa sta cercando di comunicare o visualizzare?

Tutti i punti nel triangolo devono soddisfare i due vincoli: tra zero e uno in ciascuna dimensione ( ) e tutti sommati a uno ( ).θ 0 + θ 1 + θ 2 = 10θ1θ0+θ1+θ2=1

Il modo in cui ho finalmente capito è il seguente:

figura

Quindi (a) mostra uno spazio 3D con come coordinate. Esse variano solo tra 0 e 1.θ1,2,3

In (b), viene mostrato un triangolo, questo è il nostro simplex.

(c) mostra due punti di esempio che "giacciono" sul simplex che soddisfano anche il secondo criterio (somma fino a uno).

(d) mostra un altro punto di esempio sul simplex, gli stessi vincoli valgono

In (e), ho provato a mostrare una proiezione del simplex su un triangolo 2-D con tutti i punti di esempio mostrati prima.

Spero che abbia più senso ora :)


2
Bella foto. È tuo? In caso negativo, potresti fornire un riferimento e la sua fonte?
Tim

1
Grazie. È mio (disegnato con Inkscape), posso fornire l'SVG se necessario ...
John Doe,

2

Il grafico 2.14 (a) mostra un piano composto da tre vertici su ciascun asse. La distanza di un vertice dall'origine è , corrispondente a una delle classi . La regione racchiusa dal piano rosa e dai piani degli assi è probabilità di (vettore) k = 3 θθik=3θ. Supponiamo ora di inclinare quel piano in modo da avere una piramide con il piano rosa, la faccia più vicina al lettore, posizionata piatta sulla pagina. Quindi sopprimere la terza dimensione "saltar fuori" dalla pagina e invece colorare il triangolo in modo che la regione a maggiore densità, con una distanza maggiore dalla base a una superficie, sia più rossa. Questo è ciò che mostrano i grafici 2.14 (b) e 2.14 (c). Più il rosso è concentrato vicino a un vertice, più probabile è la classe associata a quel vertice. Allo stesso modo, se la regione rossa non è molto vicina a nessun vertice, non è particolarmente probabile che un evento abbia una maggiore probabilità di appartenenza a una delle classi.

Questa piramide, tuttavia, ha senso solo come una singola realizzazione della distribuzione di Dirichlet. Disegnare di nuovo dalla stessa distribuzione potrebbe produrre una piramide diversa con lunghezze per ciascuno dei vertici. La differenza chiave tra (a) e (b) / (c) è che (a) visualizza graficamente la probabilità di un sorteggio di vettore . I grafici (b) e (c) mostrano la densità di probabilità per i valori nel simplex , cioè stanno tentando di presentare la funzione di densità di probabilità per tutti i valoriθ θ k = 3 θ θ Dir ( α )θθθk=3θnel supporto. Un modo di pensare a (b) e (c) è come un punto che ha un colore rosso aggiuntivo in base all'altezza media tra il piano rosa piatto e la superficie della piramide, mediata su molti disegni di .θDir(α)


Alcuni punti non sono ancora chiari. Forse perché il mio inglese debole. "La regione racchiusa dal piano rosa e dai piani degli assi è la densità." È quello lo spazio vuoto della piramide sotto il piano rosa? Anche "densità"? Cosa intendi? Come quello che ho capito è che dir (x1, x2, x3) è un valore, come viene la densità qui nel grafico?
Jack Twain,

Sì, tra il piano rosa e i piani formati dalle linee nere in 2.14 (a) è lo spazio della piramide che stavo cercando di descrivere. Dispiace per la confusione!
Sycorax dice di reintegrare Monica il

Modificherò il mio post per spiegare ulteriormente ciò che non è ancora chiaro
Jack Twain il

il fatto è che la regione rosa è esattamente il supporto descritto nel libro. poiché theta_k <= 1 e sum (theta_k) = 1. Una volta immaginato, user777 ha perfettamente ragione.
Scratch

@ user777 Ho appena apportato una modifica al post
Jack Twain,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.