Qual è la probabilità che dato ?


10

Supponiamo che X e Y siano normali bivariati con media μ=(μ1,μ2) e covarianza Σ=[σ11σ12σ12σ22] . Qual è la probabilità Pr(X<Y|min(X,Y)) ?


@whuber grazie, ho eliminato i miei pensieri perché non aggiungono nulla qui.
AdamO,

1
Pr(m<Y|X=m)Pr(m<Y|X=m)+Pr(m<X|Y=m)
Sesto Empirico,

link utile stats.stackexchange.com/questions/30588/… È una domanda di autoapprendimento?
Sesto Empirico

Dovresti condividere le tue opinioni sul problema, indipendentemente dal fatto che questo sembri una domanda di autoapprendimento.
Testardo:

Risposte:


7

Usando la notazione leggermente più esplicita , dove è un numero reale, non una variabile casuale. L'insieme su cui è un percorso a forma di L con due segmenti semiaperti: uno che sale dritto dal punto e un altro che va dritto a destra da questo stesso punto. È chiaro che sulla gamba verticale, e sulla gamba orizzontale .m min ( X , Y ) = m ( m , m ) x < y x > yP(X<Y|min(X,Y)=m)mmin(X,Y)=m(m,m)x<yx>y

mu1 = 0, mu2 = 2, sigma11 = 0,5, sigma22 = 1, sigma12 = 0.2, m = 1

Data questa intuizione geometrica è facile riscrivere il problema in una forma equivalente, dove nel numeratore abbiamo solo la gamba verticale dove e nel denominatore abbiamo la somma delle due gambe.x<y

(1)P(X<Y|min(X,Y))=P(m<Y|X=m)P(m<Y|X=m)+P(m<X|Y=m)

Quindi ora dobbiamo calcolare due espressioni della forma . Tali probabilità condizionali della distribuzione normale bivariata hanno sempre una distribuzione normale con parametri:N ( μ X | Y = m , s 2 X | Y = m )P(m<X|Y=m)N(μX|Y=m,sX|Y=m2)

(2)μX|Y=m=μ1+σ12σ22(mμ2)

(3)sX|Y=m2=σ11σ122σ22

Si noti che nella definizione originale del problema, faceva riferimento a elementi della matrice di covarianza, contrariamente alla convenzione più comune di usare per la deviazione standard. Di seguito, troveremo più conveniente usare per la varianza e per la deviazione standard della distribuzione di probabilità condizionale. σ s 2 sσijσs2s

Conoscendo questi due parametri, possiamo calcolare la probabilità di dalla funzione di distribuzione cumulativa.m<X

(4)P(m<X|Y=m)=Φ(μX;Y=mmsX;Y=m)

mutatis mutandis , abbiamo un'espressione simile per . PermettereP(Y>m|X=m)

(5)zX|Y=m=μX;Y=mmsX;Y=m

e

(6)zY|X=m=μY;X=mmsY;X=m

Quindi possiamo scrivere la soluzione completa in modo compatto in termini di questi due punteggi :z

(7)P(X<Y|min(X,Y)=m)=1Φ(zX|Y=m)Φ(zX|Y=m)+Φ(zY|X=m)

Sulla base del codice di simulazione fornito dall'autore della domanda, possiamo confrontare questo risultato teorico con i risultati simulati:

inserisci qui la descrizione dell'immagine


In (3) penso che il lato sinistro dovrebbe avere un quadrato, perché è la varianza condizionale mentre la deviazione standard viene utilizzata in seguito.
Yves,

Hai ragione @Yves, e credo che le mie recenti modifiche abbiano risolto il problema. Grazie.
Oolooney,

@olooney, grazie per questa risposta. Posso seguire la derivazione e sembra corretto. Tuttavia, ho provato a verificare (1) e (7) in una simulazione e i risultati erano piuttosto diversi. Puoi vedere il mio codice R qui gist.github.com/mikeguggis/d041df05565f63f8be2c6c51f5cf8961
mike

@mike, penso di aver avuto un errore di segno. Dopo aver risolto ciò, il risultato teorico sembra concordare con i risultati della simulazione. gist.github.com/olooney/e88a66d2d2fa7f2f0cd0d0dd6b708739
olooney

@olooney, buona cattura. Non riesco ancora a capire perché le due stime basate sulla simulazione non corrispondono (righe 30-32 nel mio codice).
mike

1

Pr

Pr(X<Y|min(X,Y)=m)=Pr(min(X,Y)=m|X<Y)Pr(X<Y)Pr(min(X,Y)=m|X<Y)Pr(X<Y)+Pr(min(X,Y)=m|XY)Pr(XY)=Pr(X<Y,min(X,Y)=m)Pr(X<Y,min(X,Y)=m)+Pr(XY,min(X,Y)=m).

fX,YXYφ(X)=12πeXp(-12X2)Φ(X)=-Xφ(t)dt

Pr(X<Y,min(X,Y)=m)=Pr(X=m,Y>m)=mfX,Y(m,t)dt

e

Pr(XY,mion(X,Y)=m)=Pr(Xm,Y=m)=mfX,Y(t,m)dt

Usando la normalità e la definizione di probabilità condizionale, gli integrandi possono essere riscritti come

fX,Y(m,t)=fY|X(t)fX(m)=1σY|Xϕ(tμY|XσY|X)1σ11ϕ(mμ1σ11)

e

fX,Y(t,m)=fX|Y(t)fY(m)=1σX|Yϕ(tμX|YσX|Y)1σ22ϕ(mμ2σ22).

μX|Y=μ1+σ12σ22(mμ2),

μY|X=μ2+σ12σ11(mμ1),

σX|Y=(1σ122σ11σ22)σ11

e

σY|X=(1σ122σ11σ22)σ22.

così

Pr(X<Y|min(X,Y)=m)=(1Φ(mμY|XσY|X))1σ11ϕ(mμ1σ11)(1Φ(mμY|XσY|X))1σ11ϕ(mμ1σ11)+(1Φ(mμX|YσX|Y))1σ22ϕ(mμ2σ22).

Questa forma finale è molto simile al risultato a cui @olooney è arrivato. La differenza è che le sue probabilità non sono ponderate dalle densità normali.

Uno script R per la verifica numerica è disponibile qui

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.