Formula di probabilità per una distribuzione multivariata-bernoulli


13

Ho bisogno di una formula per la probabilità di un evento in una distribuzione di Bernoulli n-variate X{0,1}n con data P(Xi=1)=pi probabilità per un singolo elemento e per coppie di elementi P(Xi=1Xj=1)=pij . Equivalentemente ho potuto dare media e covarianza di X .

Ho già imparato che esistono molte {0,1}n distribuzioni che hanno le proprietà così come ci sono molte distribuzioni che hanno una data media e covarianza. Sto cercando un canonico su {0,1}n , proprio come il gaussiano è una distribuzione canonica per Rn e una data media e covarianza.

Risposte:


11

La variabile casuale che assume valori in è una variabile casuale discreta. La sua distribuzione è completamente descritta dalle probabilità p i = P ( X = i ) con i{ 0 , 1 } n . Le probabilità p i e p i j fornite sono somme di p i per determinati indici i .{0,1}npi=P(X=i)i{0,1}npipijpii

Ora sembra che tu voglia descrivere usando solo p i e p i j . Non è possibile senza assumere determinate proprietà su p i . Per vedere che prova a derivare funzione caratteristica di X . Se prendiamopipipijpiX otteniamon=3

Eei(t1X1+t2X2+t3X3)=p000+p100eit1+p010eit2+p001eit3+p110ei(t1+t2)+p101ei(t1+t3)+p011ei(t2+t3)+p111ei(t1+t2+t3)
Non è possibile riorganizzare questa espressione in modo che piscompaiono. Per la variabile casuale gaussiana la funzione caratteristica dipende solo dalla media e dai parametri di covarianza. Le funzioni caratteristiche definiscono in modo univoco le distribuzioni, quindi è per questo che il gaussiano può essere descritto in modo univoco usando solo media e covarianza. Come vediamo per la variabile casuale non è così.X

 


10

Vedi il seguente documento:

JL Teugels, Alcune rappresentazioni del multivariato Bernoulli e distribuzioni binomiali , Journal of Multivariate Analysis , vol. 32, n. 2, febbraio 1990, 256–268.

Ecco l'abstract:

Le versioni multivariate ma vettorializzate per Bernoulli e le distribuzioni binomiali sono stabilite usando il concetto di prodotto Kronecker dal calcolo della matrice. La distribuzione multivariata di Bernoulli comporta un modello parametrizzato, che fornisce un'alternativa al tradizionale modello log-lineare per variabili binarie.


2
Grazie per averlo condiviso, Hamed. Benvenuti nel nostro sito!
whuber

1

Non so come si chiama la distribuzione risultante, o se ha anche un nome, ma mi colpisce il modo ovvio per impostare questo è pensare al modello che useresti per modellare un 2 × 2 × 2 × … × 2 tabella che utilizza un modello log-lineare (regressione di Poisson). Dato che conosci solo le interazioni del 1 ° ordine, è quindi naturale supporre che tutte le interazioni di ordine superiore siano zero.

P(X1=x1,X2=x2,,Xn=xn)=i[pixi(1pi)1xij<i(pijpipj)xixj]

This formula has notational problems: there are p's on the left and the right. The right side makes no reference at all to the subscript i. Furthermore, still interpreting the pi as probabilities (as in the original question), the rhs clearly is positive whereas the lhs cannot be positive.
whuber

@whuber Quite right! I stick by the model I set out in the first para, but my equation was screwed up in several ways... Goes to show I haven't actually used log-linear modelling of contingency tables since my MSc, and I haven't got the notes or books to hand. I believe I've fixed it now though. Let me know if you agree! Apols for the delay. Some days my brain just doesn't do algebra.
onestop

1
I don't think this works. Assume pi=1/n and pij=0ij. This is a valid combination of probabilities, realized when I is a uniform random variable {1,...,n} and XI=1 and all Xj=0jI. Still the formula above would be 0 for all events. Still thanks for helping!
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.