Perché la convoluzione funziona?


11

Quindi so che se vogliamo trovare la distribuzione di probabilità di una somma di variabili casuali indipendenti , possiamo calcolarla dalle distribuzioni di probabilità di e , dicendoX+YXY

fX+Y(a)=x=fX,Y(X=x,Y=ax) dx=x=fX(x)fY(ax) dx

Intuitivamente, questo ha un senso, perché se vogliamo trovare la probabilità che due variabili casuali somma , è fondamentalmente la somma delle probabilità di tutti gli eventi che portano a tali variabili sommatori ad . Ma come posso dimostrare formalmente questa affermazione?aa


Domanda leggermente diversa, ma la risposta è simile .
Carl,

Risposte:


10

La soluzione più generale considera dove e non sono necessariamente indipendenti. Una strategia di soluzione comune per problemi in cui ti stai chiedendo da dove provenga un PDF o come giustificarlo, è invece trovare un cumulativo probabilmente, quindi differenziarlo per ridurre il CDF in PDF.X YZ=X+YXY

È abbastanza facile vedere che in quel caso dove è la regione del piano - per cui .R x y x + y zFZ(z)=P(Zz)=RfX,Y(x,y)dxdyRxyx+yz

Questa è la regione tratteggiata in blu nel diagramma seguente. È naturale integrarsi in questa regione suddividendolo in strisce: l'ho fatto con strisce verticali, ma quelle orizzontali lo faranno. In effetti finisco con una striscia per ciascuna coordinata , che va da a , e lungo ogni striscia voglio che i valori non superino la linea , quindi .- y x + y = z y z - xxyx+y=zyzx

z <x + y

Limiti ora abbiamo ottenuto di integrazione in termini di ed , possiamo fare una sostituzione , come segue, con l'obiettivo di ottenere apparire come limite superiore di . La matematica è semplice fintanto che capisci l' uso del giacobino per cambiare le variabili.xyu=xv=x+yzv

FZ(z)=x=x=y=y=zxfX,Y(x,y)dxdy=v=v=zu=y=fX,Y(u,vu)dudv

Finché sono soddisfatte determinate condizioni possiamo differenziare sotto il segno integrale rispetto a per ottenere:z

fZ(z)=fX,Y(u,zu)du

Funziona anche se e non sono indipendenti. Ma se lo sono, possiamo riscrivere la densità articolare come prodotto dei due marginali:XY

fZ(z)=fX(u)fY(zu)du

La variabile fittizia può essere scritta senza danni come se lo si desidera.xux

La mia notazione per gli integrali segue esattamente la Sezione 6.4 di Geoffrey Grimmett e Dominic Walsh, Probability: An Introduction , Oxford University Press, New York, 2000.


+1 In termini di notazione, la convenzione è che il differenziale all'esterno dell'integrale multiplo si applica all'integrale esterno; quindi, in un'espressione della forma l'integrazione rispetto a viene fatta per prima - è l'integrale interno - e quella rispetto a è fatto per ultimo - è l'integrale esterno. Questo ci lascia liberi di posizionare le parentesi senza cambiare il significato, come in . dxdyxy(dx)dy
whuber

1
@whuber, a pensarci bene, questa è certamente la convenzione che viene applicata praticamente in tutti i libri di testo che conosco (quindi l'integrazione multipla è in realtà integrali nidificati). Ma sfogliando, Grimmett e Welsh "Probabilità: un'introduzione" sono assolutamente coerenti con la propria convenzione dello stesso ordine sinistra-destra sia per i limiti che per i differenziali, per esempio danno ! uvw...dudvdw
Silverfish,

Sono costantemente divertito da come, all'intersezione di molti campi, siamo esposti a convenzioni contrastanti. È una delle gioie di lavorare con persone di diversa estrazione.
whuber

@whuber Sono consapevole del fatto che le convenzioni per la definizione degli integrali variano notevolmente tra i vari Paesi: questo ti piacerà da Tex SE tex.stackexchange.com/a/88961/25866 e vorrei che fosse ampliato per coprire l'integrazione multipla!
Silverfish,

10

L'affermazione è vera se e solo se il lato destro si comporta come una densità per ; questo è,X+Y

FX+Y(a)=P(X+Ya)=afX+Y(z)dz=a(fX(x)fY(zx)dx)dz

per tutti . Verifica questo iniziando dal lato destro.a

Applica il teorema di Fubini per cambiare l'ordine di integrazione e fare la sostituzione . Il determinante del suo giacobino è , quindi non vengono introdotti termini aggiuntivi da questo cambiamento di variabili. Si noti che poiché ed sono in uno-a-uno corrispondenza e se e solo se , possiamo riscrivere l'integrale comez=x+y1zy<za<y<ax

=(axfX(x)fY(y)dy)dx.

Per definizione questo è l'integrale over diR2

=I(x+ya)fX(x)fY(y)dydx

dove è la funzione indicatore di un set. Infine, poiché e sono indipendenti, per tutti , rivelando l'integrale come mera aspettativaIXYf(X,Y)(x,y)=fX(x)fY(y)(x,y)

=I(x+ya)f(X,Y)(x,y)dydx=E(I(X+Ya))=P(X+Ya),

come desiderato.


Più in generale, anche quando uno o entrambi o non hanno una funzione di distribuzione, possiamo ancora ottenereXY

FX+Y(a)=EX(FY(aX))=EY(FX(aY))

direttamente dalle definizioni di base, usando le aspettative degli indicatori per andare avanti e indietro tra le probabilità e le aspettative e sfruttando il presupposto di indipendenza per spezzare il calcolo in aspettative separate rispetto a e :XY

P(X+Ya)=E(I(X+Ya))=EX(EY(I(X+Ya))=EX(PY(YaX))=EX(FY(aX)).

Ciò include le solite formule per variabili casuali discrete, ad esempio, sebbene in una forma leggermente diversa dal solito (perché è indicato in termini di CDF piuttosto che di funzioni di massa di probabilità).

Se hai un teorema abbastanza forte sull'interscambio di derivati ​​e integrali, puoi differenziare entrambi i lati rispetto a per ottenere la densità in un colpo,afX+Y

fX+Y(a)=ddaFX+Y(a)=EX(ddaFY(aX))=EX(fY(aX))=fX(x)fY(ax)dx.
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.