Varianza di una funzione di una variabile casuale


33

Diciamo che abbiamo una variabile casuale X con varianza e media note. La domanda è: qual è la varianza di f(X) per una determinata funzione f. L'unico metodo generale di cui sono a conoscenza è il metodo delta, ma fornisce solo approssimazione. Ora sono interessato a f(x)=x , ma sarebbe anche bello conoscere alcuni metodi generali.

Modifica 29.12.2010
Ho fatto alcuni calcoli usando le serie di Taylor, ma non sono sicuro che siano corretti, quindi sarei felice se qualcuno potesse confermarli .

E[f(X)]
E[f(X)]E[f(μ)+f(μ)(Xμ)+12f(μ)(Xμ)2]=f(μ)+12f(μ)Var[X]

Ora possiamo approssimareD2[f(X)]
E[(f(X)E[f(X)])2]E[(f(μ)+f(μ)(Xμ)+12f(μ)(Xμ)2E[f(X)])2]

Usando l'approssimazione di sappiamo che f (\ mu) -Ef (x) \ approx - \ frac {1} {2} \ cdot f '' (\ mu) \ cdot Var [X]E[f(X)]f(μ)Ef(x)12f(μ)Var[X]

Usando questo otteniamo:
D2[f(X)]14f(μ)2Var[X]212f(μ)2Var[X]2+f(μ)2Var[X]+14f(μ)2E[(Xμ)4]+12f(μ)f(μ)E[(Xμ)3]
D2[f(X)]14f(μ)2[D4X(D2X)2]+f(μ)D2X+12f(μ)f(μ)D3X


Il metodo Delta viene utilizzato per le distribuzioni asintotiche. Non puoi usare quando hai solo una variabile casuale.
mpiktas,

@mpiktas: In realtà non so molto sul metodo Delta, ho appena letto qualcosa su Wikipedia. Questa è una citazione dal wiki: "Il metodo delta usa espansioni di Taylor del secondo ordine per approssimare la varianza di una funzione di una o più variabili casuali".
Tomek Tarczynski,

sembra che Wikipedia abbia esattamente quello che vuoi: en.wikipedia.org/wiki/… . Reiterò la mia risposta, sembra che abbia sottovalutato l'espansione di Taylor.
mpiktas,

Tomek, se non sei d'accordo con le modifiche che sono state apportate (non da me), puoi sempre cambiarle di nuovo o ripristinarle o semplicemente sottolineare le differenze e chiedere chiarimenti.
Glen_b -Restate Monica

2
@Glen_b: sono d'accordo con loro E (X-mu) = 0 non implica che E [(X-mu) ^ 3] = 0.
Tomek Tarczynski

Risposte:


33

Aggiornare

Ho sottovalutato le espansioni di Taylor. Funzionano davvero. Ho ipotizzato che l'integrale del termine rimanente possa essere illimitato, ma con un po 'di lavoro si può dimostrare che non è così.

L'espansione di Taylor funziona per funzioni a intervallo chiuso limitato. Per le variabili casuali con varianza finita dà la disuguaglianza di Chebyshev

P(|XEX|>c)Var(X)c

Quindi per qualsiasi ε>0 possiamo trovare abbastanza grande c modo che

P(X[EXc,EX+c])=P(|XEX|c)<1ε

Prima di tutto stimiamo . Abbiamo E f ( X ) = | x - E X | c f ( x ) d F ( x ) + | x - E X | > c f ( x ) d F ( x ) dove F ( x ) è la funzione di distribuzione perEf(X)

Ef(X)=|xEX|cf(x)dF(x)+|xEX|>cf(x)dF(x)
F(x) .X

Poiché il dominio del primo integrale è intervallo che è intervallo chiuso limitato possiamo applicare l'espansione di Taylor: f ( x ) = f ( E X ) + f ( E X ) ( x - E X ) + f ( E X )[EXc,EX+c] doveα[EX-c,EX+c], e l'uguaglianza vale per tuttix[EX-c,EX+c]. Ho preso solo 4 termini nell'espansione di Taylor, ma in generale possiamo prenderne quanti ne vogliamo, purché la funzionefsia abbastanza regolare.

f(x)=f(EX)+f(EX)(xEX)+f(EX)2(xEX)2+f(α)3(xEX)3
α[EXc,EX+c]x[EXc,EX+c]f

Sostituendo questa formula alla precedente che otteniamo

Ef(X)=|xEX|cf(EX)+f(EX)(xEX)+f(EX)2(xEX)2dF(x)+|xEX|cf(α)3(xEX)3dF(x)+|xEX|>cf(x)dF(x)

Ef(X)=f(EX)+f(EX)2E(XEX)2+R3
R3=f(α)3E(XEX)3++|xEX|>c(f(EX)+f(EX)(xEX)+f(EX)2(xEX)2+f(X))dF(x)
P(|XEX|>c)E(XEX)3fE(XEX)3=0

f(x)Ef(x)

E(f(x)Ef(x))2=(f(EX))2Var(X)+T3

T3E(XEX)kK=4,5,6. Possiamo arrivare a questa formula anche usando solo l'espansione di Taylor del primo ordine, cioè usando solo il primo e il secondo derivato. Il termine di errore sarebbe simile.

Other way is to expand f2(x):

f2(x)=f2(EX)+2f(EX)f(EX)(xEX)+[(f(EX))2+f(EX)f(EX)](XEX)2+(f2(β))3(XEX)3

Similarly we get then

Ef2(x)=f2(EX)+[(f(EX))2+f(EX)f(EX)]Var(X)+R~3
where R~3 is similar to R3.

The formula for variance then becomes

Var(f(X))=[f(EX)]2Var(X)[f(EX)]24Var2(X)+T~3
where T~3 have only third moments and above.

I dont need to know the exact value of the variance, approximation should works for me.
Tomek Tarczynski

Indeed, the approximate formula for E[f(X)] in the OP is often used in risk analysis in economics, finance and insurance.
Raskolnikov

@Raskolnikov, yes but it contradicts my admitedly stale knowledge of Taylor expansion. Clearly the remainder term must be taken into account. If the random variable is bounded, then no problem, since polynomials approximate continuous functions on bounded interval uniformly. But we deal with unbounded random variables. Of course for random normal we can say that it is effectively bounded, but still in general case, some nasty surprises can arise, or not. I will fix my answer when I'll have the clear answer.
mpiktas

2
@Tomek Tarczynski, the third derivative of x goes to zero quite quickly for large x, but is unbounded near zero. So if you picked uniform distribution with support close to zero, the remainder term can get large.
mpiktas

1
Note that in your link the the equality is approximate. In this answer all the equations are exact. Furthermore for the variance note that the first derivative is estimated at the EX, not x. Also I never stated that this will not work for x, only that for x the approximate formula might have huge error if X domain is close to zero.
mpiktas

8

To know the first two moments of X (mean and variance) is not enough, if the function f(x) is arbitrary (non linear). Not only for computing the variance of the transformed variable Y, but also for its mean. To see this -and perhaps to attack your problem- you can assume that your transformation function has a Taylor expansion around the mean of X and work from there.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.