Costruzione della distribuzione di Dirichlet con distribuzione Gamma


18

Sia X1,,Xk+1 variabili variabili casuali indipendenti, ognuna con una distribuzione gamma con parametri αi,i=1,2,,k+1 mostrano che , hanno una distribuzione congiunta comeYi=XiX1++Xk+1,i=1,,kDirichlet(α1,α2,,αk;αk+1)

PDF congiunto di Quindi trovare pdf di Non riesco a trovare jacobian, cioè(X1,,Xk+1)=ei=1k+1xix1α11xk+1αk+11Γ(α1)Γ(α2)Γ(αk+1)(Y1,,Yk+1)J(x1,,xk+1y1,,yk+1)


3
Dai un'occhiata alle pagine 13-14 di questo documento .

@Procrastinator Grazie mille per la tua migliore risposta al tuo documento.
Argha,

2
@Procrastinator - forse dovresti metterlo come una risposta, dal momento che l'OP ne è contento, e aggiungere un paio di frasi in modo da non far scattare l'avvertenza "Vogliamo più di una frase"?
jbowman,

4
Quel documento ora è una non-risposta perché è un 404.
whuber

2
Wayback machine to the rescue: pdf
mobeets

Risposte:


30

I giacobini - i determinanti assoluti del cambiamento di funzione variabile - sembrano formidabili e possono essere complicati. Tuttavia, sono una parte essenziale e inevitabile del calcolo di un cambiamento multivariato di variabile. Sembrerebbe che non ci sia nient'altro che annotare una matrice k+1 di k+1 di derivati ​​e fare il calcolo.

C'è un modo migliore. Viene mostrato alla fine nella sezione "Soluzione". Poiché lo scopo di questo post è di presentare agli statistici quello che potrebbe essere un nuovo metodo per molti, gran parte di esso è dedicato alla spiegazione dei meccanismi alla base della soluzione. Questa è l'algebra delle forme differenziali . (Le forme differenziali sono le cose che si integrano in più dimensioni.) Un esempio dettagliato e lavorato è incluso per aiutare a renderlo più familiare.


sfondo

Oltre un secolo fa, i matematici hanno sviluppato la teoria dell'algebra differenziale per lavorare con i "derivati ​​di ordine superiore" che si verificano nella geometria multidimensionale. Il determinante è un caso speciale degli oggetti di base manipolati da tali algebre, che in genere si alternano in forme multilineari . La bellezza di questo sta nel modo in cui i calcoli possono diventare semplici.

Ecco tutto ciò che devi sapere.

  1. Un differenziale è un'espressione della forma " dxi ". È la concatenazione di " d " con qualsiasi nome di variabile.

  2. Una forma unica è una combinazione lineare di differenziali, come dx1+dx2 o anche x2dx1exp(x2)dx2 . Cioè, i coefficienti sono funzioni delle variabili.

  3. I moduli possono essere "moltiplicati" utilizzando un prodotto a cuneo , scritto . Questo prodotto è anti-commutativo (chiamato anche alternato ): per due forme ω e η ,

    ωη=ηω.

    Questa moltiplicazione è lineare e associativa: in altre parole, funziona in modo familiare. Una conseguenza immediata è che ωω=ωω , sottintendendo il quadrato di una sola forma è sempre zero. Ciò rende la moltiplicazione estremamente semplice!

  4. Ai fini della manipolazione degli integrandi che compaiono nei calcoli di probabilità, un'espressione come dx1dx2dxk+1 può essere intesa come |dx1dx2dxk+1|.

  5. Quando y=g(x1,,xn) è una funzione, il suo differenziale è dato dalla differenziazione:

    dy=dg(x1,,xn)=gx1(x1,,xn)dx1++gx1(x1,,xn)dxn.

La connessione con i giacobini è questa: il giacobino di una trasformazione (y1,,yn)=F(x1,,xn)=(f1(x1,,xn),,fn(x1,,xn)) è, fino a segno, semplicemente il coefficiente di che appare nell'informaticadx1dxn

dy1dyn=df1(x1,,xn)dfn(x1,,xn)

dopo aver espanso ognuna delle come una combinazione lineare della d x j nella regola (5).dfidxj


Esempio

La semplicità di questa definizione di giacobino è allettante. Non sei ancora convinto che valga la pena? Considera il noto problema di convertire integrali bidimensionali da coordinate cartesiane in coordinate polari ( r , θ ) , dove ( x , y ) = ( r cos ( θ ) , r sin ( θ ) ) . Quella che segue è un'applicazione completamente meccanica delle regole precedenti, dove " ( )(x,y)(r,θ)(x,y)=(rcos(θ),rsin(θ))()"è usato per abbreviare espressioni che ovviamente scompariranno in virtù della regola (3), che implica .drdr=dθdθ=0

dxdy=|dxdy|=|d(rcos(θ))d(rsin(θ))|=|(cos(θ)drrsin(θ)dθ)(sin(θ)dr+rcos(θ)dθ|=|()drdr+()dθdθrsin(θ)dθsin(θ)dr+cos(θ)drrcos(θ)dθ|=|0+0+rsin2(θ)drdθ+rcos2(θ)drdθ|=|r(sin2(θ)+cos2(θ))drdθ)|=r drdθ.

The point of this is the ease with which such calculations can be performed, without messing about with matrices, determinants, or other such multi-indicial objects. You just multiply things out, remembering that wedges are anti-commutative. It's easier than what is taught in high school algebra.


Preliminaries

Let's see this differential algebra in action. In this problem, the PDF of the joint distribution of (X1,X2,,Xk+1) is the product of the individual PDFs (because the Xi are assumed to be independent). In order to handle the change to the variables Yi we must be explicit about the differential elements that will be integrated. These form the term dx1dx2dxk+1. Including the PDF gives the probability element

fX(x,α)dx1dxk+1(x1α11exp(x1))(xk+1αk+11exp(xk+1))dx1dxk+1=x1α11xk+1αk+11exp((x1++xk+1))dx1dxk+1.

(The normalizing constant has been ignored; it will be recovered at the end.)

Staring at the definitions of the Yi a few seconds ought to reveal the utility of introducing the new variable

Z=X1+X2++Xk+1,

giving the relationships

Xi=YiZ.

This suggests making the change of variables xiyiz in the probability element. The intention is to retain the first k variables y1,,yk along with z and then integrate out z. To do so, we have to re-express all the dxi in terms of the new variables. This is the heart of the problem. It's where the differential algebra takes place. To begin with,

dxi=d(yiz)=yidz+zdyi.

Note that since Y1+Y2++Yk+1=1, then

0=d(1)=d(y1+y2++yk+1)=dy1+dy2++dyk+1.

Consider the one-form

ω=dx1++dxk=z(dy1++dyk)+(y1++yk)dz.

It appears in the differential of the last variable:

dxk+1=zdyk+1+yk+1dz=z(dy1++dyk)+(1y1yk)dz=dzω.

The value of this lies in the observation that

dx1dxkω=0

because, when you expand this product, there is one term containing dx1dx1=0 as a factor, another containing dx2dx2=0, and so on: they all disappear. Consequently,

dx1dxkdxk+1=dx1dxkzdx1dxkω=dx1dxkz.

Whence (because all products dzdz disappear),

dx1dxk+1=(zdy1+y1dz)(zdyk+ykdz)dz=zkdy1dykdz.

The Jacobian is simply |zk|=zk, the coefficient of the differential product on the right hand side.


Solution

The transformation (x1,,xk,xk+1)(y1,,yk,z) is one-to-one: its inverse is given by xi=yiz for 1ik and xk+1=z(1y1yk). Therefore we don't have to fuss any more about the new probability element; it simply is

(zy1)α11(zyk)αk1(z(1y1yk))αk+11exp(z)|zkdy1dykdz|=(zα1++αk+11exp(z)dz)(y1α11ykαk1(1y1yk)αk+11dy1dyk).

That is manifestly a product of a Gamma(α1++αk+1) distribution (for Z) and a Dirichlet(α) distribution (for (Y1,,Yk)). In fact, since the original normalizing constant must have been a product of Γ(αi), we deduce immediately that the new normalizing constant must be divided by Γ(α1++αk+1), enabling the PDF to be written

fY(y,α)=Γ(α1++αk+1)Γ(α1)Γ(αk+1)(y1α11ykαk1(1y1yk)αk+11).
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.