Sì, questo è corretto. Fondamentalmente, hai
fX, Y( x , y) = fX| Y( x | y) fY( y) ,
e come hai detto, puoi campionare dalla densità articolare. Raccogliere solo le dai campioni ti porta a un campione dalla distribuzione marginale.X
Questo perché l'atto di ignorare è simile all'integrazione su di esso. Comprendiamolo con un esempio.y
Supponiamo che = altezza delle madri e = altezza della figlia. L'obiettivo è quello di ottenere un campione da per comprendere la relazione tra le altezze delle figlie e le loro madri. (Sto supponendo che ci sia una sola figlia in famiglia e che limiti la popolazione a tutte le figlie di età superiore ai 18 anni per garantire la piena crescita).Y ( X , Y )XY( X, Y)
Esci e ottieni un campione rappresentativo
( x1, y1) , ... , ( xN, yN) .
Quindi, per ogni madre, hai l'altezza della loro figlia. Dovrebbe esserci una chiara relazione tra e . Supponiamo ora dal tuo set di dati, di ignorare tutti i dati sulle figlie (rilasciare la ), quindi cosa hai? Hai esattamente altezze di madri scelte a caso che saranno trae dalla marginale di .Y Y N XXYYNX