Quali sono le distribuzioni sul quadrante k-dimensionale positivo con matrice di covarianza parametrizzabile?


12

Seguendo la domanda di zzk sul suo problema con le simulazioni negative, mi chiedo quali siano le famiglie parametrizzate di distribuzioni sul quadrante k-dimensionale positivo, per le quali è possibile impostare la matrice di covarianza .R+kΣ

Come discusso con zzk , partire da una distribuzione su e applicare la trasformazione lineare non funziona.R+kXΣ1/2(Xμ)+μ

Risposte:


6

Supponiamo di avere un vettore casuale normale multivariato con e matrice definita positiva simmetrica di rango completo .μ R k k × k Σ = ( σ i j )

(logX1,,logXk)N(μ,Σ),
μRkk×kΣ=(σij)

Per il lognormale non è difficile dimostrare che m i : = E [ X i ] = e μ i + σ i i / 2(X1,,Xk)c i j : = Cov [ X i , X j ] = m i

mi:=E[Xi]=eμi+σii/2,i=1,,k,
cij:=Cov[Xi,Xj]=mimj(eσij1),i,j=1,,k,

e ne consegue che .cij>mimj

Quindi, possiamo fare la domanda : dato e matrice definita positiva simmetrica , soddisfacente , se lasciamo avremo un vettore lognormale con i mezzi e le covarianze prescritte. k × k C = ( c i j ) c i j > - m i m j μ i = log m i - 1m=(m1,,mk)R+kk×kC=(cij)cij>mimjσ i j = log ( c i j

μi=logmi12log(ciimi2+1),i=1,,k,
σij=log(cijmimj+1),i,j=1,,k,

Il vincolo su e è equivalente alla condizione naturale .m E [ X i X j ] > 0CmE[XiXj]>0


Fantastico, Paulo! Hai ottenuto una soluzione funzionante e le condizioni adeguate sulla matrice di covarianza, che risponde anche a questa domanda . I log-normali si dimostrano più maneggevoli dei gamme, alla fine.
Xi'an,

3

In realtà, ho una soluzione decisamente pedonale.

  1. Inizia con e scegli i due parametri per adattarli ai valori di , .X1Ga(α11,β1)E[X1]var(X1)
  2. Prendi e scegli i tre parametri per adattarli ai valori di , e .X2|X1Ga(α21X1+α22,β2)E[X2]var(X2)cov(X1,X2)
  3. Prendi e scegli i quattro parametri per adattarli ai valori di , , e .X3|X1,X2Ga(α31X1+α32X2+α33,β3)E[X3]var(X3)cov(X1,X3)cov(X2,X3)

e così via ... Tuttavia, dati i vincoli sui parametri e la natura non lineare delle equazioni del momento, è possibile che alcuni insiemi di momenti corrispondano a nessun insieme accettabile di parametri.

Ad esempio, quando , con il sistema di equazioni k=2

β1=μ1/σ12,α11μ1β1=0

α22=μ2β2α21μ1,α21=(σ12+μ1μ2μ2)σ12+μ12μ1β2
μ Σ R 2 +
(σ12+μ1μ2μ2)2(σ12+μ12μ1)2σ12+μ2β2=σ22.
L'esecuzione di un codice R con valori arbitrari (e a priori accettabili) per e portato a molti casi senza soluzione. Ancora una volta, questo non significa molto perché le matrici di correlazione per le distribuzioni su possono avere restrizioni più forti di un semplice determinante positivo.μΣR+2

aggiornamento (04/04): in seguito riformulato questa domanda come una nuova domanda nel forum di matematica.


1
Un modo per estenderlo leggermente è considerare la famiglia esponenziale naturale Allora la media e la covarianza sono il gradiente e tela di . Se è un polinomio (con esponenti reali> -1), allora è il registro di un polinomio (con esponenti reali) e la varianza e l'Assia sono funzioni razionali. Penso che questo dia abbastanza libertà per rappresentare qualsiasi matrice media e di covarianza.
f(X|θ)=h(x)eθTXA(θ).
AhA
dal

@deinst: (+1) Hai un esempio in cui questa esponenziale rappresentazione familiare può essere sfruttata in modo diretto?
Xi'an,

2
Forse non capisco bene il problema. Tuttavia, considera un vettore casuale bivariato con lo stesso marginale con pieno supporto su e con media . Come può un tale distribuzione bivariata avere correlazione vicino a -1, per esempio? Dal punto di vista euristico, anche se non l'ho realizzato, sembra che se , allora dovesse sorgere una contraddizione riguardo al supporto. No? (X,Y)FR+0<μ<ρP(X>2μ)>0
cardinale

1
Esistono certamente vincoli sulla matrice di covarianza quando il supporto è , coperto dalla condizione del momento Stieltjes . Ad ogni modo, non vedo perché una correlazione vicina a -1 sia esclusa a priori . ΣR+k
Xi'an,

2
Bene, questo è legato a ciò a cui stavo arrivando. Per quanto riguarda la correlazione, considera il mio esempio. Se e hanno la stessa marginale con media e una correlazione esattamente di -1 e , quale deve essere il valore di per tutte queste realizzazioni di ? (+1 su entrambe le domande e le risposte. Mi piace.)XYFμP(X>2μ)>0YX
Cardinale

2

OK, questa è una risposta al commento di Xi'an. È troppo lungo e deve essere troppo TeX per essere un commento comodo. Avvertimento: è praticamente certo che ho fatto un errore di algebra. Questo non sembra essere abbastanza flessibile come pensavo inizialmente.

Creiamo una famiglia di distribuzioni in nella forma Sia e . Let è un polinomio di due termini in cui sono numeri reali maggiori di 0 per tutti . Quindi lo troviamo R+3

f(x|θ)=h(x)eθTxA(θ)
x=(x,y,z)θ=(θ1,θ2,θ3)
h(x)=cx1e11x2e21x3e31+dx1f11x2f21x3f31
ei,fii
A(θ)=log(cΓ(e1)θ1e1Γ(e2)θ2e2Γ(e3)θ3e3+dΓ(f1)θ1f1Γ(f2)θ2f2Γ(f3)θ3f3).

Ora, per comodità, definiamo e

c=cΓ(e1)Γ(e2)Γ(e2)θ1f1θ2f2θ3f3
d=dΓ(f1)Γ(f2)Γ(f2)θ1e1θ2e2θ3e3

Ora, poiché la media della nostra distribuzione è il gradiente di , abbiamo , e . E poiché la covarianza è l'Assia di , abbiamo e (gli altri termini della matrice di covarianza ottenuti modificando i pedici in modo ovvio).AμX=e1c+f1dθ1(c+d)μY=e2c+f2dθ2(c+d)μZ=e3c+f3dθ3(c+d)A Cov(X,Y)=(e1-f1)(e2-f2)cd

σX2=(e1c+f1d)(c+d)+(e1f1)2cdθ12(c+d)2
Cov(X,Y)=(e1f1)(e2f2)cdθ1θ2(c+d)

Questa non sembra essere abbastanza flessibilità per ottenere una matrice di covarianza. Ho bisogno di provare un altro termine nel polinomio (ma sospetto che anche questo potrebbe non funzionare (ovviamente ho bisogno di pensarci più)).


Quattro parametri per cinque vincoli ...? (θ1,θ2,θ3,c)
Xi'an,

@xian Ci sono anche i 6 esponenti e . f ieifi
dal

Sono leggermente (?) Confuso: non hai elaborato gli esponenti come parametri della famiglia esponenziale. Ma in effetti puoi cambiare quei poteri come desideri per ottenere le equazioni dei 9 momenti giusti.
Xi'an,

@ Xi'an Hai ragione, non li ho elaborati come parametri della famiglia esponenziale. In questo modo la famiglia non sarebbe più diventata una famiglia naturale, e includerli avrebbe solo confuso l'algebra per il calcolo delle equazioni del momento (che era abbastanza confuso per cominciare).
dal
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.