Differenza di due variabili casuali lognormali iid

Sia $X_1$ e $X_2$ 2 iidrv dove $\log(X_1),\log(X_2) \sim N(\mu,\sigma)$ . Mi piacerebbe conoscere la distribuzione per $X_1 - X_2$ .

Il meglio che posso fare è prendere la serie di Taylor di entrambi e capire che la differenza è la somma della differenza tra due camper normali e due camper chi-quadrati oltre al resto della differenza tra il resto dei termini. Esiste un modo più diretto per ottenere la distribuzione della differenza tra 2 iid log-normal rv's?

— frayedchef
fonte

Ecco un documento pertinente. Troverai più articoli su Google! papers.ssrn.com/sol3/papers.cfm?abstract_id=2064829

— kjetil b halvorsen

Ho dato un'occhiata superficiale a quel documento e non sembra rispondere alla mia domanda in modo soddisfacente. Sembrano preoccuparsi delle approssimazioni numeriche al problema più difficile di trovare la distribuzione per la somma / differenza tra camper lognormali correlati . Speravo che ci sarebbe stata una risposta più semplice per il caso indipendente.

— frayedchef,

Potrebbe essere una risposta più semplice nel caso indipendente, ma non semplice! Il caso lognormale è un caso noto noto - la funzione generatrice del momento della distribuzione lognormale non esiste - cioè non converge su un intervallo aperto contenente zero. Quindi, non troverai una soluzione facile.

— kjetil b halvorsen,

Capisco ... Quindi l'approccio che ho descritto sopra sarebbe ragionevole? (cioè se

Y_{i} = \log (X_{i})

$Y_i = \log(X_i)$

Sappiamo qualcosa sui termini di ordine superiore o su come vincolarli?

X_{1} - X_{2} \approx (Y_{1} - Y_{2}) + (Y_{1}^{2} - Y_{2}^{2}) / 2 + . . .

$X_1 - X_2 \approx (Y_1 - Y_2) + (Y_1^2 - Y_2^2)/2 + {} ...$

— frayedchef,

Per illustrare la difficoltà --- il logfale mgf è definito solo su

. Per approssimare la distribuzione della differenza con metodi a sella, abbiamo bisogno di (K = gf cumulativo)

, e tale somma è definita solo in un punto, zero, quindi non sembra funzionare. La somma o la media sarebbero più semplici!

(- \infty, 0]

$(-\infty,0]$

K (s) + K (- s)

$K(s)+K(-s)$

— kjetil b halvorsen

Risposte:

Questo è un problema difficile Ho pensato prima di usare (qualche approssimazione di) la funzione generatrice del momento della distribuzione lognormale. Non funziona, come spiegherò. Ma prima un po 'di notazione:

Sia la densità normale standard e la corrispondente funzione di distribuzione cumulativa. Analizzeremo solo la distribuzione lognormale del caso , che ha la funzione di densità $\phi$ $\Phi$ $lnN(0,1)$ e funzione di distribuzione cumulativa Supponiamo cheesiano variabili casuali indipendenti con la distribuzione lognormale sopra. Siamo interessati alla distribuzione di, che è una distribuzione simmetrica con zero medio. Letla funzione generatrice dei momenti di. È definito solo per

f (X) = \frac{1}{\sqrt{2 π} X} e^{- \frac{1}{2} (\ln X)^{2}}

$f(x)=\frac1{\sqrt{2\pi}x} e^{-\frac12 (\ln x)^2}$

F (X) = Φ (\ln X)

$F(x) =\Phi(\ln x)$

X

$X$

Y

$Y$

D = X - Y

$D=X-Y$

M (t) = E e^{t X}

$M(t) = \DeclareMathOperator{\E}{E} \E e^{tX}$

X

$X$

, quindi non definito in un intervallo aperto contenente zero. La funzione di generazione del momento per

Quindi, la funzione di generazione del momento per

è definita solo per

t \in (- \infty, 0]

$t\in (-\infty,0]$

D

$D$

M_{D} (t) = E e^{t (X - Y)} = E e^{t X} E e^{- t Y} = M (t) M (- t)

$M_D(t)=\E e^{t(X-Y)}= \E e^{tX} \E e^{-tY}= M(t)M(-t)$

D

$D$

t = 0

$t=0$ , quindi non molto utile.

$D$ $t\ge 0$

\begin{aligned} P (D \leq t) & = P (X - Y \leq t) \\ = \int_{0}^{\infty} P (X - y \leq t | Y = y) f (y) d y \\ = \int_{0}^{\infty} P (X \leq t + y) f (y) d y \\ = \int_{0}^{\infty} F (t + y) f (y) d y \end{aligned}

$\begin{align} P(D \le t) &= P(X-Y\le t) \\ &= \int_0^\infty P(X-y\le t | Y=y) f(y) \; dy \\ &= \int_0^\infty P(X\le t+y) f(y) \; dy \\ &= \int_0^\infty F(t+y) f(y) \; dy \end{align}$

t < 0

$t<0$

P (D \leq t) = 1 - P (D \leq | t |)

$P(D\le t)=1-P(D\le |t|)$

Questa espressione può essere utilizzata per l'integrazione numerica o come base per la simulazione. Prima un test:

 integrate(function(y) plnorm(y)*dlnorm(y), lower=0,  upper=+Inf)
  0.5 with absolute error < 2.3e-06

che è chiaramente corretto. Cerchiamo di concludere questo in una funzione:

pDIFF  <-  function(t) {
    d  <-  t
    for (tt in seq(along=t)) {
        if (t[tt] >= 0.0) d[tt] <- integrate(function(y) plnorm(y+t[tt])*dlnorm(y),
                                         lower=0.0,  upper=+Inf)$value else
                          d[tt] <- 1-integrate(function(y) plnorm(y+abs(t[tt]))*dlnorm(y),
                                         lower=0.0, upper=+Inf)$value
    }
    return(d)
}

> plot(pDIFF,  from=-5,  to=5)

che dà:

Quindi possiamo trovare la funzione di densità differenziando sotto il segno integrale, ottenendo

dDIFF  <-  function(t) {
       d  <- t; t<- abs(t)
       for (tt in seq(along=t)) {
           d[tt]  <-  integrate(function(y) dlnorm(y+t[tt])*dlnorm(y),
                                lower=0.0,  upper=+Inf)$value
       }
       return(d)
}

che possiamo testare:

> integrate(dDIFF,  lower=-Inf,  upper=+Inf)
0.9999999 with absolute error < 1.3e-05

E tracciando la densità otteniamo:

plot(dDIFF,  from=-5,  to=5)

Ho anche cercato di ottenere un'approssimazione analitica, ma finora non ci sono riuscito, non è un problema facile. Ma l'integrazione numerica come sopra, programmata in R è molto veloce su hardware moderno, quindi è una buona alternativa che probabilmente dovrebbe essere usata molto di più.

— kjetil b halvorsen
fonte

$X$ $Y$

\begin{aligned} Pr (\frac{X}{Y} \leq t) & = Pr (\log (\frac{X}{Y}) \leq \log (t)) \\ = Pr (\log (X) - \log (Y) \leq \log (t)) \\ ~ N (0, 2 σ^{2}) \end{aligned}

$\begin{align} \Pr\left(\frac{X}{Y} \leq t\right) &= \Pr\left(\log\left(\frac{X}{Y}\right) \leq \log(t) \right) \\ &= \Pr(\log(X) - \log(Y) \leq \log(t)) \\ &\sim \mathcal{N}(0, 2 \sigma^2) \end{align}$

A seconda dell'applicazione, questo può soddisfare le tue esigenze.

— Vincent Traag
fonte

Ma non stiamo guardando XY invece di log (X) - log (Y)?

— Sesto Empirico

Sì, naturalmente. Questo è nel caso in cui qualcuno fosse interessato a sapere come due variabili lognormali differiscono l'una dall'altra senza che sia necessariamente necessario fare la differenza. Ecco perché dico anche che non risponde alla domanda.

— Vincent Traag,