Qual è il valore atteso della distribuzione modificata di Dirichlet? (problema di integrazione)


14

È facile produrre una variabile casuale con la distribuzione di Dirichlet utilizzando le variabili Gamma con lo stesso parametro di scala. Se:

XiGamma(αi,β)

Poi:

(X1jXj,,XnjXj)Dirichlet(α1,,αn)

Problema Cosa succede se i parametri di scala non sono uguali?

XiGamma(αi,βi)

Allora, qual è la distribuzione questa variabile?

(X1jXj,,XnjXj)?

Per me sarebbe sufficiente conoscere il valore atteso di questa distribuzione.
Ho bisogno di una formula algebrica chiusa approssimativa che può essere valutata molto rapidamente da un computer.
Diciamo che l'approssimazione con una precisione di 0,01 è sufficiente.
Puoi presumere che:

αi,βiN

Nota In breve, il compito è trovare un'approssimazione di questo integrale:

f(α,β)=R+nx1jxjjβjαjΓ(αj)xjαj1eβjxjdx1dxn


1
@ Łukasz Puoi aggiungere altro sui parametri , e ? È possibile ottenere espressioni esatte per e quindi approssimare le aspettative dei rapporti, ma per alcune combinazioni di parametri si potrebbero sfruttare approssimazioni normali o a sella con meno lavoro. Non credo che ci sarà un metodo di approssimazione universale, motivo per cui sarebbero gradite ulteriori restrizioni. α i β i j X jnαiβijXj
whuber

X1 e sono correlati, quindi dobbiamo approssimare l'integrale stesso. è spesso un numero piccolo come 1 o 2 e talvolta grande quanto 10000. Allo stesso modo con ma di solito è 10 volte più grande di . α i β i α ijXjαiβiαi
Łukasz Lew,

Il problema è con piccolo . Se tutti sono grandi, la buona approssimazione dell'intero integrale è:α i α 1 / β 1αiαiα1/β1jαj/βj
Łukasz Lew

@ Łukasz Se è necessario valutare l'espressione dell'attesa, perché è necessaria una formula algebrica? Sto pensando di applicare qualche trucco numerico per ottenere le aspettative, ma ho bisogno di un feedback :)
deps_stats

Devo valutarlo molte volte nel mio programma. Deve essere molto veloce, cioè senza anelli e preferibilmente non troppe divisioni.
Łukasz Lew,

Risposte:


2

Solo un'osservazione iniziale, se vuoi la velocità computazionale di solito devi sacrificare la precisione. "More accurate" = "Più tempo" in generale. Comunque ecco un'approssimazione del secondo ordine, dovrebbe migliorare l'approssimazione "grezza" che hai suggerito nel tuo commento sopra:

E(XjiXi)E[Xj]E[iXi]cov[iXi,Xj]E[iXi]2+E[Xj]E[iXi]3Var[iXi]
=αjiβjβiαi×[11(iβjβiαi)+1(iαiβi)2(iαiβi2)]

EDIT È stata richiesta una spiegazione per l'espansione di cui sopra. La risposta breve è Wikipedia . La risposta lunga è riportata di seguito.

scrivi . Ora abbiamo bisogno di tutti i derivati ​​del "secondo ordine" di . I derivati ​​del primo ordine si "annullano" perché coinvolgeranno tutti i multipli e che sono entrambi zero quando si assumono aspettative.f(x,y)=xyfXE(X)YE(Y)

2fx2=0
2fxy=1y2
2fy2=2xy3

E così la serie taylor fino al secondo ordine è data da:

xyμxμy+12(1μy22(xμx)(yμy)+2μxμy3(yμy)2)

Presa dei rendimenti attesi:

E[xy]μxμy1μy2E[(xμx)(yμy)]+μxμy3E[(yμy)2]

Qual è la risposta che ho dato. (anche se inizialmente ho dimenticato il segno meno nel secondo termine)


Sembra esattamente quello di cui ho bisogno. Puoi spiegare come hai ottenuto questa espansione? Ho provato in molti modi e non sono riuscito a farlo ...
Łukasz Lew,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.