Campionamento dalla distribuzione marginale usando la distribuzione condizionale?


12

Voglio campionare da una densità univariata ma conosco solo la relazione:fX

fX(x)=fX|Y(x|y)fY(y)dy.

Voglio evitare l'uso di MCMC (direttamente sulla rappresentazione integrale) e, poiché e sono facili da campionare, stavo pensando di usare il seguente campionatore :f Y ( y )fX|Y(x|y)fY(y)

  1. Per j=1,,N .
  2. Esempio yjfY .
  3. Esempio xjfX|Y(|yj) .

Quindi, finirò con le coppie (x_1, y_1), ..., (x_N, y_N)(x1,y1),...,(xN,yN) e prenderò solo i campioni marginali (x1,,xN) . È corretto?

Risposte:


10

Sì, questo è corretto. Fondamentalmente, hai

fX,Y(x,y)=fX|Y(x|y)fY(y),

e come hai detto, puoi campionare dalla densità articolare. Raccogliere solo le dai campioni ti porta a un campione dalla distribuzione marginale.x

Questo perché l'atto di ignorare è simile all'integrazione su di esso. Comprendiamolo con un esempio.y

Supponiamo che = altezza delle madri e = altezza della figlia. L'obiettivo è quello di ottenere un campione da per comprendere la relazione tra le altezze delle figlie e le loro madri. (Sto supponendo che ci sia una sola figlia in famiglia e che limiti la popolazione a tutte le figlie di età superiore ai 18 anni per garantire la piena crescita).Y ( X , Y )XY(X,Y)

Esci e ottieni un campione rappresentativo

(x1,y1),,(xN,yN).

Quindi, per ogni madre, hai l'altezza della loro figlia. Dovrebbe esserci una chiara relazione tra e . Supponiamo ora dal tuo set di dati, di ignorare tutti i dati sulle figlie (rilasciare la ), quindi cosa hai? Hai esattamente altezze di madri scelte a caso che saranno trae dalla marginale di .Y Y N XXYYNX


Grazie per questo, questo è utile. Sai se questa strategia di campionamento può essere collegata al campionamento di Gibbs per giustificarlo formalmente?
Rod,

1
Se è possibile campionare facilmente dalla distribuzione congiunta, ignorare per ottenere il marginale per non necessita di giustificazione. È una cosa comune da fare. Forse, puoi dire che è una variabile di Linchpin , ma dal momento che non hai bisogno del campionamento di Gibbs per campionare da , qui non è necessario MCMC. x y yyxyy
Greenparker,

1
Greenparker, ma esiste una prova formale di tale affermazione, vale a dire considerando che solo una parte del campione prelevato dall'articolazione fornisce un campione marginale?
Un vecchio nel mare.

Campionare "X = madri" campionando (X, Y) e prendendo X in realtà ti dà campioni di "madri che hanno esattamente una figlia adulta", che non è la stessa cosa di "madri". Ma anche se cambiamo il tuo esempio per dire che sei interessato a "X = madri che hanno esattamente una figlia adulta", arrivare a X campionando (X, Y) inclina il tuo campione in base alla distribuzione di Y. p (v ) = ∑ (u in support (U)) (p (u, v))) = ∑ (u in support (U)) (p (v | u) * p (u))) = (1 / sampleSize ( u)) * ∑ (u in sample (U)) (p (v | u))), perché ogni valore di u appare nel campione con probabilità p (u) - quindi è necessario fare la media di p (v | u) disegna
radumanolescu il
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.