I passaggi per capire una distribuzione posteriore quando potrebbe essere abbastanza semplice avere una forma analitica?


12

Questo è stato anche chiesto a Computational Science.

Sto cercando di calcolare una stima bayesiana di alcuni coefficienti per un'autoregressione, con 11 campioni di dati: where è gaussiano con media 0 e varianza La distribuzione precedente sul vettore è gaussiana con media e una matrice di covarianza diagonale con voci diagonali pari a .

Yi=μ+αYi1+ϵi
ϵiσe2(μ,α)t(0,0)σp2

Basato sulla formula di autoregressione, ciò significa che la distribuzione dei punti dati ( ) è normale con media e varianza \ sigma_ {e} ^ { 2} . Pertanto, la densità per tutti i punti dati (Y) congiuntamente (assumendo l'indipendenza, che va bene per il programma che sto scrivendo), sarebbe: p (Y \ quad | (\ mu, \ alpha) ^ {t}) = \ prod_ {i = 2} ^ {11} \ frac {1} {\ sqrt {2 \ pi \ sigma_ {e} ^ {2}}} \ exp {\ frac {- (Y_ {i} - \ mu - \ alpha \ cdot {} Y_ {i-1}) ^ {2}} {2 \ sigma_ {e} ^ {2}}}.Yiμ+αYi1σe2(Y)

p(Y|(μ,α)t)=i=21112πσe2exp(YiμαYi1)22σe2.

Secondo il teorema di Bayes, possiamo prendere il prodotto della densità sopra con la densità precedente, e quindi avremo solo bisogno della costante normalizzante. La mia impressione è che questo dovrebbe funzionare come una distribuzione gaussiana, quindi possiamo preoccuparci della costante normalizzante alla fine piuttosto che calcolarla esplicitamente con integrali su μ e α .

Questa è la parte con cui ho problemi. Come posso calcolare la moltiplicazione della densità precedente (che è multivariata) e questo prodotto di densità di dati univariate? La parte posteriore deve essere puramente una densità di μ e α , ma non riesco a vedere come riuscirai a ottenere questo prodotto.

Qualsiasi suggerimento è davvero utile, anche se mi indichi nella giusta direzione e quindi devo andare a fare l'algebra disordinata (che è ciò che ho già tentato più volte).

Come punto di partenza, ecco la forma del numeratore dalla regola di Bayes:

1(2πσe2)52πσp2exp[12σe2i=211(YiμαYi1)2μ22σp2α22σp2].

Il problema è come vedere che ciò si riduce a una densità gaussiana di .(μ,α)t

aggiunto

In definitiva, questo si riduce al seguente problema generale. Se ti viene data un'espressione quadratica come come la metti in una forma quadratica per una matrice 2x2 ? È abbastanza semplice in casi semplici, ma quale processo usi per ottenere le stime medie, e ?( μ - μ , α - α ) Q ( μ - μ , α - α ) t Q μ α

Aμ2+Bμα+Cα2+Jμ+Kα+L
(μμ^,αα^)Q(μμ^,αα^)tQμ^α^

Nota, ho provato l'opzione semplice di espandere la formula della matrice e quindi provare ad equiparare i coefficienti come sopra. Il problema, nel mio caso, è che la costante è zero, e quindi finisco per ottenere tre equazioni in due incognite, quindi è sottodeterminato per abbinare solo i coefficienti (anche se presumo una matrice simmetrica quadratica).L


La mia risposta a [questa domanda] ( stats.stackexchange.com/questions/22852/… ) può essere utile. Si noti che è necessario un precedente per la prima osservazione: le iterazioni si fermano qui.
probabilityislogic

Non vedo perché ne ho bisogno in questo caso. Dovrei trattare gli intervalli di tempo come se fossero condizionatamente indipendenti data l'osservazione. Si noti che il prodotto della densità del giunto è solo da . Non penso che dovrei ottenere una formula aggiornata in sequenza qui, solo una singola formula per la posteriore . p ( ( μ , αi=2..11p((μ,α)t|Y)
ely,

Il "multivariato" nel precedente non è in contraddizione con l '"univariato" nelle densità dei dati, perché sono densità negli . y ip(α,μ)yi
Xi'an,

Risposte:


7

L'indizio che era nella mia risposta alla risposta precedente è quello di vedere come ho integrato i parametri, perché qui farai esattamente gli stessi integrali. La tua domanda presuppone che i parametri di varianza siano noti, quindi sono costanti. Devi solo guardare la dipendenza dal numeratore. Per vedere questo, nota che possiamo scrivere:α,μ

= 1

p(μ,α|Y)=p(μ,α)p(Y|μ,α)p(μ,α)p(Y|μ,α)dμdα
=1(2πσe2)52πσp2exp[12σe2i=211(YiμαYi1)2μ22σp2α22σp2]1(2πσe2)52πσp2exp[12σe2i=211(YiμαYi1)2μ22σp2α22σp2]dμdα

Notate come possiamo tirare il primo fattore fuori del doppio integrale sul denominatore e si annulla con il numeratore. Possiamo anche estrarre la somma dei quadrati e si annullerà anche. L'integrale che ci rimane è ora (dopo aver ampliato il termine al quadrato): exp [ -11(2πσe2)52πσp2exp[12σe2i=211Yi2]

=exp[10μ2+α2i=110Yi22μi=211Yi2αi=211YiYi1+2μαi=110Yi2σe2μ22σp2α22σp2]exp[10μ2+α2i=110Yi22μi=211Yi2αi=211YiYi1+2μαi=110Yi2σe2μ22σp2α22σp2]dμdα

Ora possiamo usare un risultato generale dal normale pdf.

-az2+bzczμa=

exp(az2+bzc)dz=πaexp(b24ac)
Questo segue dal completamento del quadrato su e dal notare che non dipende da . Si noti che l'integrale interno sopra è di questo modulo con e e . Dopo aver fatto questo integrale, troverai che l'integrale rimanente suaz2+bzczμ b= 11 i = 2 Yi-α 10 i = 1 Yia=102σe2+12σp2b=i=211Yiαi=110Yiσe2 αa,b,cc=α2i=110Yi22αi=211YiYi12σe2+α22σp2αè anche di questo modulo, quindi puoi usare di nuovo questa formula, con una diversa . Quindi dovresti essere in grado di scrivere il tuo posteriore nella forma dove è una matricea,b,c V 2 × 212π|V|12exp[12(μμ^,αα^)V1(μμ^,αα^)T]V2×2

Fammi sapere se hai bisogno di più indizi.

aggiornare

(nota: formula corretta, dovrebbe essere invece di )μ 210μ2μ2

se osserviamo la forma quadratica che hai scritto nell'aggiornamento, notiamo che ci sono coefficienti ( è irrilevante per il posteriore in quanto possiamo sempre aggiungere qualsiasi costante che si annullerà nel denominatore). Abbiamo anche incognite . Quindi questo è un problema "ben posto" fintanto che le equazioni sono linearmente indipendenti. Se espandiamo il quadratico otteniamo:litri5Lμ , α , Q 11 , Q 12 = Q5μ^,α^,Q11,Q12=Q21,Q22(μμ^,αα^)Q(μμ^,αα^)t

Q11(μμ^)2+Q22(αα^)2+2Q12(μμ^)(αα^)
=Q11μ2+2Q21μα+Q22α2(2Q11μ^+2Q12α^)μ(2Q22α^+2Q12μ^)α+
+Q11μ^2+Q22α^2+2Q12μ^α^

Confrontando il coefficiente del secondo ordine otteniamo che ci dice che aspetto ha la matrice (inversa) di covarianza. Inoltre abbiamo due equazioni un po 'più complicato per dopo aver sostituito per . Questi possono essere scritti in forma di matrice come:A=Q11,B=2Q12,C=Q22α^,μ^Q

(2ABB2C)(μ^α^)=(JK)

Pertanto le stime sono fornite da:

(μ^α^)=(2ABB2C)1(JK)=14ACB2(BK2JCBJ2KA)

Dimostrando che non abbiamo stime uniche a meno che . Ora abbiamo: 4ACB2

A=102σe2+12σp2B=i=110Yiσe2C=i=110Yi22σe2+12σp2J=i=211Yiσe2K=i=211YiYi1σe2

Nota che se definiamo per e prendiamo il limite le stime per sono date dai soliti minimi quadrati stima e dove e . Quindi le stime posteriori sono una media ponderata tra le stime OLS e la stima precedente . i =Xi=Yi1σ 2 pu , αi=2,,11σp2μ,αα^=i=211(YiY¯)(XiX¯)i=211(XiX¯)2μ^=Y¯α^X¯Y¯=110i=211Yi ( 0 , 0 )X¯=110i=211Xi=110i=110Yi(0,0)


Questo non è particolarmente utile perché ho menzionato specificamente che non è il denominatore che conta qui. Il denominatore è solo una costante normalizzante, che sarà evidente una volta ridotto il numeratore in una forma gaussiana. Quindi i trucchi per valutare gli integrali nel denominatore sono matematicamente davvero interessanti, ma non sono necessari per la mia applicazione. L'unico problema di cui ho bisogno di risoluzione è la manipolazione del numeratore.
ely,

Questa risposta ti dà sia numeratore che denominatore. Il numeratore mostra il corretto polinomio di secondo grado in che porta alla normale forma quadratica, come sottolineato da probabilitlogico. (α,μ)
Xi'an,

@ems - calcolando la costante normalizzante costruirai la forma quadratica richiesta. conterrà i termini necessari per compllete piazza
probabilityislogic

Non capisco come questo ti dia la forma quadratica. Ho elaborato i due integrali nel denominatore usando l'identità integrale gaussiana che hai pubblicato. Alla fine, ottengo solo un'enorme costante disordinata. Non sembra esserci un modo chiaro per prendere quella costante e trasformarla in qualcosa a volte determinante della potenza 1/2, ecc. Per non parlare del fatto che nulla di tutto ciò spiega come calcolare il nuovo " mean vector ' .. Questo è ciò per cui stavo chiedendo aiuto nella domanda originale. (μ^,α^)t
ely,

Grazie tremendamente per l'aggiunta dettagliata. Stavo facendo degli errori sciocchi quando provavo a fare l'algebra per capire la forma quadratica. Anche i tuoi commenti sulla relazione con lo stimatore OLS sono molto interessanti e apprezzati. Penso che questo accelererà il mio codice perché sarò in grado di disegnare campioni da una forma analitica che ha metodi integrati e ottimizzati. Il mio piano originale era di usare Metropolis-Hastings per provare da questo, ma era molto lento. Grazie!
ely,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.