Variabile casuale uniforme come somma di due variabili casuali


18

Tratto da Grimmet e Stirzaker :

Mostra che non può essere il caso cui è uniformemente distribuito su [0,1] e e sono indipendenti e identicamente distribuiti. Non si deve supporre che X e Y siano variabili continue.U X YU=X+YUXY

Una semplice prova per suffissi contraddizione per il caso in cui X , Y vengono assunte discreto sostenendo che sempre possibile trovare una u e u tale che P(Uu+u)P(Uu) mentre P(X+Yu)=P(X+Yu+u) .

Tuttavia questa dimostrazione non si estende a X,Y essendo assolutamente continuo o singolare continuo. Suggerimenti / commenti / Critica?


3
Suggerimento : le funzioni caratteristiche sono i tuoi amici.
cardinale il

1
X e Y sono iid quindi le loro funzioni caratteristiche devono essere identiche. Tuttavia, è necessario utilizzare la funzione caratteristica non la funzione generatrice del momento - il mgf non è garantito per X, quindi mostrare il mgf ha una proprietà impossibile non significa che non ci sia tale X. Tutti i camper hanno una funzione caratteristica, quindi se mostri che ha una proprietà impossibile, allora non esiste X.
Silverfish,

1
Se le distribuzioni di e hanno degli atomi , dire che , quindi e quindi non possono essere distribuiti uniformemente su . Pertanto, non è necessario considerare il caso delle distribuzioni di e hanno atomi. YXYP { X + Y = 2 a } b 2 > 0 X + Y [ 0 , 1 ] X YP{X=a}=P{Y=a}=b>0P{X+Y=2a}b2>0X+Y[0,1]XY
Dilip Sarwate,

Risposte:


13

Il risultato può essere dimostrato con un'immagine: le aree grigie visibili mostrano che una distribuzione uniforme non può essere scomposta come somma di due variabili indipendenti identicamente distribuite.

Notazione

Sia e identificati in modo tale che abbia una distribuzione uniforme su . Ciò significa che per tutti ,Y X + Y [ 0 , 1 ] 0 a b 1XYX+Y[0,1]0ab1

Pr(a<X+Yb)=ba.

Il supporto essenziale della distribuzione comune di e è quindi (altrimenti vi sarebbe una probabilità positiva che si trovi al di fuori di ).Y [ 0 , 1 / 2 ] X + Y [ 0 , 1 ]XY[0,1/2]X+Y[0,1]

La foto

Lascia . Contempla questo diagramma che mostra come vengono calcolate le somme di variabili casuali:0<ϵ<1/4

Figure

La distribuzione di probabilità sottostante è quella comune per . La probabilità di qualsiasi evento è data dalla probabilità totale coperta dalla banda diagonale che si estende tra le linee e . Vengono mostrate tre di queste bande: da a , che appare come un piccolo triangolo blu in basso a sinistra; da a , mostrato come un rettangolo grigio ricoperto da due triangoli (giallo e verde); e da a , che appare come un piccolo triangolo rosso in alto a destra.un < X + Y b x + y = a x + y = b 0 ε 1 / 2 - ε 1 / 2 + ε 1 - ε 1(X,Y)a<X+Ybx+y=ax+y=b0ϵ1/2ϵ1/2+ϵ1ϵ1

Cosa mostra l'immagine

Confrontando il triangolo in basso a sinistra nella figura con il quadrato in basso a sinistra che lo contiene e sfruttando l'ipotesi iid per e , è chiaro cheXY

ϵ=Pr(X+Yϵ)<Pr(Xϵ)Pr(Yϵ)=Pr(Xϵ)2.

Si noti che la disuguaglianza è rigorosa: l'uguaglianza non è possibile perché c'è qualche probabilità positiva che sia che siano inferiori a ma tuttavia .Y ϵ X + Y > ϵXYϵX+Y>ϵ

Allo stesso modo, confrontando il triangolo rosso con il quadrato nell'angolo in alto a destra,

ϵ=Pr(X+Y>1ϵ)<Pr(X>1/2ϵ)2.

Infine, confrontando i due triangoli opposti in alto a sinistra e in basso a destra con la fascia diagonale che li contiene si ottiene un'altra disuguaglianza rigorosa,

2ϵ<2Pr(Xϵ)Pr(X>1/2ϵ)<Pr(1/2ϵ<X+Y1/2+ϵ)=2ϵ.

I primi ne consegue disuguaglianza dalla due precedenti (prendono le loro radici quadrate e si moltiplicano loro) mentre la seconda descrive la (rigoroso) inclusione dei triangoli all'interno della banda e l'ultima uguaglianza esprime l'uniformità di . La conclusione che è la contraddizione che dimostra che e non possono esistere, QED .X+Y2ϵ<2ϵXY


3
(+1) Mi piace questo approccio. Riprendendo il retro di una busta dal cestino della carta straccia posso vedere che ho disegnato lo stesso diagramma, tranne per il fatto che non ho segnato sui triangoli gialli e verdi all'interno della banda. Ho ottenuto le disuguaglianze per i triangoli blu e rosso. Ho giocato con loro e alcune altre probabilità, ma non ho mai pensato di indagare sulla probabilità della striscia, che risulta essere il passo critico. Mi chiedo quale processo di pensiero possa aver motivato questa visione?
Silverfish

In effetti, dove @whuber ha triangoli gialli e verdi, ho disegnato i quadrati (in effetti avevo decomposto in una griglia). Guardando il passo, che "descrive la (severa) l'inclusione dei triangoli all'interno della band", 2 Pr ( X ε ) Pr ( X > 1 / 2 - ε ) < Pr ( 1 / 2 - ε < X + Y 1 / 2 + ε )[0,0.5]22Pr(Xϵ)Pr(X>1/2ϵ)<Pr(1/2ϵ<X+Y1/2+ϵ), Mi chiedo se questo sarebbe effettivamente geometricamente più naturale con i quadrati che ricoprono la banda rispetto ai triangoli?
Silverfish,

1
@ Argento Mi è venuta in mente un'analisi delle somme di distribuzioni uniformi che ho pubblicato un paio di anni fa. Ciò ha suggerito di visualizzare la somma geometricamente. Era immediatamente evidente che molta probabilità doveva essere concentrata in prossimità degli angoli ( 0 , 0 ) e ( 1 / 2 , 1 / 2 ) in ordine per la somma deve essere uniforme e relativamente piccola probabilità di essere vicino al centro diagonale X + Y = 1 / 2 . Ciò ha portato al diagramma, che ho rielaborato in Mathematica.X+Y(0,0)(1/2,1/2)X+Y=1/2A quel punto la risposta si è scritta da sola. Sì, l'uso dei quadrati nella banda centrale potrebbe essere più ordinato.
whuber

Grazie! "Si noti che la disuguaglianza è rigorosa: l'uguaglianza non è possibile perché c'è una certa probabilità positiva che uno di o Y sia inferiore a ϵ ma tuttavia X + Y > ϵ ." Non sono sicuro di seguire questo. Mi sembra che l'obiettivo qui sia mostrare Pr ( X + Y ϵ ) < Pr ( X ϵ Y ϵ ) , questo non richiede una probabilità positiva per qualche evento A in cui sia X cheXYϵX+Y>ϵPr(X+Yϵ)<Pr(XϵYϵ)A X sono inferiori o uguali a ϵ e tuttavia X + Y > ϵ ? È il "uno di" vs "entrambi di" sto vacillando. YϵX+Y>ϵ
Silverfish,

@Silverfish Grazie; Non l'ho espresso come avevo previsto. Hai ragione: il linguaggio ha essenzialmente lo scopo di descrivere la porzione di un quadratino non all'interno del triangolo.
whuber

10

Ho provato a trovare una prova senza considerare le funzioni caratteristiche. L'eccesso di curtosi fa il trucco. Ecco la risposta a due righe: poiché X e Y sono iid. Quindi Kurt ( U ) = - 1.2 implica Kurt ( X ) = - 2.4 che è una contraddizione come Kurt ( X )Kurt(U)=Kurt(X+Y)=Kurt(X)/2XYKurt(U)=1.2Kurt(X)=2.4 per qualsiasi variabile casuale.Kurt(X)2

Piuttosto più interessante è la linea di ragionamento che mi ha portato a quel punto. (e Y ) devono essere delimitati tra 0 e 0,5 - questo è ovvio, ma significa che esistono i suoi momenti e momenti centrali. Cominciamo considerando la media e la varianza: E ( U ) = 0,5 e Var ( U ) = 1XYE(U)=0.5 . SeXeYsono distribuiti in modo identico, allora abbiamo:Var(U)=112XY

E(X+Y)=E(X)+E(Y)=2E(X)=0.5

Quindi . Per la varianza dobbiamo inoltre utilizzare l'indipendenza per applicare:E(X)=0.25

Var(X+Y)=Var(X)+Var(Y)=2Var(X)=112

Quindi eσX=1Var(X)=124. Wow! Questa è una grande variazione per una variabile casuale il cui supporto varia da 0 a 0,5. Ma avremmo dovuto aspettarcelo, dato che la deviazione standard non si ridimensionerebbe allo stesso modo della media.σX=1260.204

Ora, qual è la deviazione standard più grande che una variabile casuale può avere se il valore più piccolo che può assumere è 0, il valore più grande che può assumere è 0,5 e la media è 0,25? Raccogliere tutta la probabilità a due punti masse agli estremi, a 0,25 di distanza dalla media, darebbe chiaramente una deviazione standard di 0,25. Quindi il nostro è grande ma non impossibile. (Speravo di dimostrare che questa probabilità implicita era troppo alta nelle code perché X + Y fosse uniforme, ma non potevo andare da nessuna parte con quello sul retro di una busta.)σXX+Y

Le considerazioni sul secondo momento pongono quasi un vincolo impossibile su quindi consideriamo i momenti più alti. Che dire del coefficiente di inclinazione del momento di Pearson , γ 1 = E ( X - μ X ) 3X ? Questo esiste poiché esistono i momenti centrali eσX0. È utile conoscere alcune proprietà degli accumulatori, in particolare l'applicazione dell'indipendenza e quindi la distribuzione identica fornisce:γ1=E(XμX)3σX3=κ3κ23/2σX0

κi(U)=κi(X+Y)=κi(X)+κi(Y)=2κi(X)

Questa proprietà di additività è precisamente la generalizzazione di come abbiamo affrontato la media e la varianza sopra - in effetti, il primo e il secondo cumulativo sono solo e κ 2 = σ 2 .κ1=μκ2=σ2

Poi e ( κ 2 ( U ) ) 3 / 2 = ( 2 κ 2 ( X ) ) 3 / 2 = 2 3 / 2 ( κ 2 ( X ) ) 3 / 2 . La frazione di γ 1 annulla per produrre Skew ( Uκ3(U)=2κ3(X)(κ2(U))3/2=(2κ2(X))3/2=23/2(κ2(X))3/2γ1 . Poiché la distribuzione uniforme ha zero asimmetria, lo stesso vale perX, ma non riesco a vedere come una contraddizione derivi da questa restrizione.Skew(U)=Skew(X+Y)=Skew(X)/2X

Quindi, invece, proviamo l'eccesso di curtosi, . Con un argomento simile (questa domanda è studio personale, quindi provalo!), Possiamo dimostrare che esiste e obbedisce:γ2=κ4κ22=E(XμX)4σX43

Kurt(U)=Kurt(X+Y)=Kurt(X)/2

La distribuzione uniforme ha eccesso di curtosi quindi abbiamo bisogno di X per avere eccessiva curtosi - 2.4 . Ma la curtosi in eccesso più piccola possibile è - 2 , che viene raggiunta dal Binomiale ( 1 , 11.2X2.42Distribuzione di Bernoulli.Binomial(1,12)


2
(+1) Questo è un approccio abbastanza intelligente, che era nuovo per me. Grazie. Nota che alcune delle tue analisi avrebbero potuto essere semplificate considerando un'uniforme centrata su zero. (L'equivalenza del problema è immediata.) Ciò ti avrebbe immediatamente detto che considerare l'inclinazione era un vicolo cieco.
cardinale il

@cardinal: sapevo che l'inclinazione era un vicolo cieco prima di lavorarci su. Lo scopo era espositivo: è una domanda di autoapprendimento quindi non volevo risolverlo per intero! Piuttosto volevo lasciare un suggerimento su come affrontare il livello successivo ...
Silverfish,

@cardinal: I was in two minds whether to center or not. I did back-of-envelope calculations more conveniently, but in the final analysis we just need (1) a simple case of the general result that Kurt(X1+...+Xn)=1nKurt(X) for iid Xi, (2) that Kurt(U)=1.2 for any uniform distribution, and (3) Kurt(X) exists since X is bounded and σX0 (which is trivial, else σU=0). So none of the key results actually required centering, though bits may have looked less ugly!
Silverfish

Yes, the word "streamlined" was carefully chosen. :-) I did not intend my comment to be read as criticism of your exposition. Cheers.
cardinal

@cardinal Incidentally, variance considerations alone almost worked, but the uniform isn't quite spread out enough. With a bit more probability mass nearer the extremes, e.g. fT(t)=12t2 on [-0.5, 0.5], then Var(T)=.15 and if T=X1+X2 then σX=.15/20.27>0.25 which is impossible as X is bounded by -0.25 and 0.25. Of course, you will see immediately how this relates to the present example! I wonder if the approach generalises, I'm sure other bounded RVs can't be decomposed into sums but require even higher moments investigated to find the contradiction.
Silverfish
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.