Costruiamo tutti i possibili esempi di variabili casuali per le quali E [ X ] E [ 1 / X ] = 1 . Quindi, tra questi, potremmo seguire alcune euristiche per ottenere l' esempio più semplice possibile. Queste euristiche consistono nel dare i valori più semplici possibili a tutte le espressioni che escono da un'analisi preliminare. Questo risulta essere l'esempio del libro di testo.XE[X]E[1/X]=1
Analisi preliminare
Ciò richiede solo un po 'di analisi in base alle definizioni. La soluzione ha solo un interesse secondario: l'obiettivo principale è quello di sviluppare approfondimenti per aiutarci a comprendere i risultati in modo intuitivo.
Per prima cosa osserva che la disuguaglianza di Jensen (o la disuguaglianza di Cauchy-Schwarz) implica che per una variabile casuale positiva , E [ X ] E [ 1 / X ] ≥ 1 , con l'uguaglianza che tiene se e solo se X è "degenerato": cioè , X è quasi sicuramente costante. Quando X è una variabile casuale negativa, - X è positivo e il risultato precedente vale con il segno di disuguaglianza invertito. Di conseguenza, qualsiasi esempio in cui E [ 1 / X ] = 1 / EXE[X]E[1/X]≥1XXX−X deve avere probabilità positive di essere negativo e probabilità positiva di essere positivo.E[1/X]=1/E[X]
L'intuizione qui è che qualsiasi con E [ X ] E [ 1 / X ] = 1 deve in qualche modo "bilanciare" la disuguaglianza dalla sua parte positiva contro la disuguaglianza nell'altra direzione dalla sua parte negativa. Ciò diventerà più chiaro man mano che procediamo.XE[X]E[1/X]=1
Prendere in considerazione qualsiasi diverso da zero variabile aleatoria . Un primo passo nella formulazione di una definizione di aspettativa (almeno quando questo viene fatto in piena generalità usando la teoria della misura) è di scomporre X nelle sue parti positive e negative, entrambe le quali sono variabili casuali positive:XX
YZ=Positive part(X)=max(0,X);=Negative part(X)=−min(0,X).
Pensiamo a come una miscela di con peso e con peso dove Ovviamente Ciò permetterà di scrivere aspettative di e in termini di aspettative delle variabili positive e .Y p - Z 1 - p p = Pr ( X > 0 ) , 1 - p = Pr ( X < 0 ) . 0 < p < 1. X 1 / X Y ZXYp−Z1−p
p=Pr(X>0), 1−p=Pr(X<0).
0<p<1.
X1/XYZ
Per semplificare un po 'l'algebra imminente, nota che il riscalare uniformemente per un numero non cambia - ma moltiplica ed ciascuno per . Per positiva , ciò equivale semplicemente a selezionare le unità di misura di . Un negativo commuta i ruoli di e . Scegliendo il segno di appropriato, possiamo quindi supporreσ E [ X ] E [ 1 / X ] E [ Y ] E [ Z ] σ σ X σ Y Z σ E [ Z ] = 1 ed E [ Y ] ≥ E [ Z ] .XσE[X]E[1/X]E[Y]E[Z]σσXσYZσ
E[Z]=1 and E[Y]≥E[Z].(1)
Notazione
Questo è tutto per semplificazioni preliminari. Per creare una bella notazione, scriviamo quindi
μ=E[Y]; ν=E[1/Y]; λ=E[1/Z]
per le tre aspettative che non possiamo controllare. Tutte e tre le quantità sono positive. La disuguaglianza di Jensen afferma
μν≥1 and λ≥1.(2)
La legge della probabilità totale esprime le aspettative di e in termini di quantità che abbiamo nominato:1 / XX1/X
E[X]=E[X∣X>0]Pr(X>0)+E[X∣X<0]Pr(X<0)=μp−(1−p)=(μ+1)p−1
e, poiché ha lo stesso segno di ,X1/XX
E[1X]=E[1X∣X>0]Pr(X>0)+E[1X∣X<0]Pr(X<0)=νp−λ(1−p)=(ν+λ)p−λ.
L'equazione del prodotto di queste due espressioni con fornisce una relazione essenziale tra le variabili:1
1=E[X]E[1X]=((μ+1)p−1)((ν+λ)p−λ).(*)
Riformulazione del problema
Supponiamo che le parti di - e - siano variabili casuali positive (degenerate o meno). Ciò determina e . Quando possiamo trovare , con , per cui vale?Y Z μ , ν , λ p 0 < p < 1 ( ∗ )XYZμ,ν,λp0<p<1(∗)
Questo articola chiaramente l'intuizione "bilanciamento" detto in precedenza solo vagamente: ci accingiamo a tenere e fisso e sperare di trovare un valore di che bilancia adeguatamente i loro contributi relativi ad . Anche se non è immediatamente evidente che tale necessità esistono, ciò che è chiaro è che esso dipende solo momenti , , e . Il problema si riduce così ad un'algebra relativamente semplice: tutta l'analisi delle variabili casuali è stata completata.Z p X p E [ Y ] E [ 1 / Y ] E [ Z ] E [ 1 / Z ]YZpXpE[Y]E[1/Y]E[Z]E[1/Z]
Soluzione
Questo problema algebrico non è troppo difficile da risolvere, perché nella peggiore delle ipotesi è un'equazione quadratica per e le disuguaglianze di governo e sono relativamente semplici. Infatti, ci dice il prodotto delle sue radici e Isp ( 1 ) ( 2 ) ( ∗ ) p 1 p 2(∗)p(1)(2)(∗)p1p2
p1p2=(λ−1)1(μ+1)(ν+λ)≥0
e la somma è
p1+p2=(2λ+λμ+ν)1(μ+1)(ν+λ)>0.
Pertanto entrambe le radici devono essere positive. Inoltre, la loro media è inferiore a , perché1
1−(p1+p2)2=λμ+ν+2μν2(μ+1)(ν+λ)>0.
(Facendo un po 'di algebra, non è difficile mostrare che la più grande delle due radici non superi neanche ).1
Un teorema
Ecco cosa abbiamo trovato:
Dato qualsiasi due variabili casuali positivi e (almeno uno dei quali è degenere) per cui , , e esistono e sono finite. Quindi esistono uno o due valori , con , che determinano una variabile di miscela con peso per e peso per e per cui . Ogni istanza del genere di una variabile casuale con è di questa forma.Z E [ Y ] E [ 1 / Y ] E [ Z ] E [ 1 / Z ] p 0 < p < 1 X p Y 1 - p - Z E [ X ] E [ 1 / X ] = 1 X E [ X ] E [ 1 / X ] = 1YZE[Y]E[1/Y]E[Z]E[1/Z]p0<p<1XpY1−p−ZE[X]E[1/X]=1XE[X]E[1/X]=1
Questo ci dà davvero un ricco set di esempi!
Costruire l'esempio più semplice possibile
Dopo aver caratterizzato tutti gli esempi, procediamo a costruirne uno il più semplice possibile.
Per la parte negativa , scegliamo una variabile degenerata, ilZ tipo più semplice di variabile casuale. Sarà ridimensionato per rendere il suo valore , da cui . La soluzione di include , riducendola a un'equazione lineare facilmente risolvibile: l'unica radice positiva è1λ=1(∗)p1=0
p=11+μ+11+ν.(3)
Per la parte positiva , non otteniamo nulla di utile se è degenerato, quindi diamo qualche probabilità con solo due distinti valori positivi , diciamo . YYa<bPr(X=b)=q In questo caso la definizione di aspettativa dà
μ=E[Y]=(1−q)a+qb; ν=E[1/Y]=(1−q)/a+q/b.
Per rendere questo ancora più semplice, rendiamo identici e :Y1/Y questo forza e . Adessoq=1−q=1/2a=1/b
μ=ν=b+1/b2.
La soluzione semplifica(3)
p=21+μ=42+b+1/b.
Come possiamo fare in modo che ciò implichi numeri semplici? Poiché e , necessariamente . Scegliamo il numero più semplice maggiore di per ; vale a dire, . La formula precedente produce e il nostro candidato per l'esempio più semplice possibile è quindia<bab=1b>11bb=2p=4/(2+2+1/2)=8/9
Pr(X=2)=Pr(X=b)=Pr(Y=b)p=qp=1289=49;Pr(X=1/2)=Pr(X=a)=Pr(Y=a)p=qp=⋯=49;Pr(X=−1)=Pr(Z=1)(1−p)=1−p=19.
Questo è proprio l'esempio offerto nel libro di testo.