Quando preferire la funzione generatrice dei momenti alla funzione caratteristica?


9

Permettere (Ω,F,P) essere uno spazio di probabilità e lasciare X:ΩRnessere un vettore casuale. Sia la distribuzione di , una misura di Borel su .PX=XPXRn

  • La funzione caratteristica di è la funzione definita per (la variabile casuale è limitata quindi in per tutte le ). Questa è la trasformata di Fourier di .X
    φX(t)=E[eitX]=ΩeitXdP,
    tRneitXL1(P)tPX
  • La funzione generatrice del momento ( mgf ) di è la funzione definita per tutto per cui esiste l'integrale sopra . Questa è la trasformata di Laplace di .X
    MX(t)=E[etX]=ΩetXdP,
    tRn PX

Possiamo già vedere che la funzione caratteristica è definita ovunque su , ma il mgf ha un dominio che dipende da , e questo dominio potrebbe essere solo (questo accade, ad esempio, per una variabile casuale distribuita da Cauchy).RnX{0}

Nonostante ciò, le funzioni caratteristiche e i mgf condividono molte proprietà, ad esempio:

  1. Se X1,,Xn sono indipendenti, quindi
    φX1++Xn(t)=φX1(t)φXn(t)
    per tutti t, e
    MX1++Xn(t)=MX1(t)MXn(t)
    per tutti t per cui esistono i mgf .
  2. Due vettori casuali X e Y avere la stessa distribuzione se e solo se φX(t)=φY(t) per tutti t. L'analogo mgf di questo risultato è che ifMX(t)=MY(t) per tutti t in alcuni quartieri di 0, poi X e Y avere la stessa distribuzione.
  3. Le funzioni caratteristiche e i mgf di distribuzioni comuni hanno spesso forme simili. Ad esempio, seXNn(μ,Σ) (ntridimensionale con media μ e matrice di covarianza Σ), poi
    φX(t)=exp(iμt12t(Σt))
    e
    MX(t)=exp(μt12t(Σt)).
  4. Quando sono valide alcune assunzioni lievi, sia la funzione caratteristica che il mgf possono essere differenziati per calcolare i momenti.
  5. Il teorema di continuità di Lévy fornisce un criterio per determinare quando una sequenza di variabili casuali converge nella distribuzione in un'altra variabile casuale usando la convergenza delle corrispondenti funzioni caratteristiche. Esiste un teorema corrispondente per mgf ( Curtiss 1942, Teorema 3 ).

Dato che le funzioni caratteristiche e i mgf sono spesso usati per lo stesso scopo e il fatto che esiste sempre una funzione caratteristica mentre un mgf non esiste sempre, mi sembra che si debba spesso lavorare con funzioni caratteristiche rispetto a quelle di mgf.

Domande.

  1. Quali sono alcuni esempi in cui i mgf sono più utili delle funzioni caratteristiche?
  2. Cosa si può fare con un mgf che non si può fare con una funzione caratteristica?

1
La chiave di questa domanda non è forse la parola "introduttiva" verso la fine? Avrebbe senso pedagogico introdurre qualcosa che implichi l'analisi di numeri complessi in un corso che presume solo un'esposizione minima al (e nessun conforto con) il calcolo elementare e spesso nemmeno quello?
whuber

1
@whuber Era qualcosa a cui pensavo anch'io, ma non voglio che la mia domanda riguardi la pedagogia, quindi forse dovrei rimuovere l'ultimo paragrafo
Artem Mavrin,

Risposte:


3

Questa è una buona domanda, ma ampia, quindi non posso promettere che dirò tutto a riguardo. La risposta breve è che le tecniche rivali differiscono non in ciò che possono fare, ma in quanto ordinatamente possono farlo.

Le funzioni caratteristiche richiedono ulteriore attenzione a causa del ruolo di numeri complessi. Non è nemmeno che lo studente abbia bisogno di conoscere numeri complessi; è che il calcolo coinvolto presenta insidie ​​sottili. Ad esempio, posso ottenere l'MGF di una distribuzione normale semplicemente completando il quadrato con una sostituzione a spostamento variabile, ma molte fonti fingono distrattamente che l'approccio usando le funzioni caratteristiche sia altrettanto facile. Non lo è, perché la famosa normalizzazione dell'integrale gaussiano non dice nulla sull'integrazioneic+R con cR{0}. Oh, possiamo ancora valutare l'integrale se stiamo attenti ai contorni, e in effetti c'è un approccio ancora più semplice, in cui mostriamo integrando per parti che unN(0,1) funzione caratteristica della distribuzione ϕ(t) soddisfa ϕ˙=tϕ. Ma l'approccio MGF è ancora più semplice e la maggior parte delle distribuzioni di cui gli studenti hanno bisogno all'inizio hanno un MGF convergente su un segmento di linea (ad esempio Laplace) o su una mezza linea (ad esempio Gamma, geometrica, binomiale negativa) o sull'interoR(es. Beta, binomiale, Poisson, Normale). Ad ogni modo, è abbastanza per studiare i momenti.

Non credo che ci sia qualcosa che puoi fare solo con MGF, ma usi ciò che è più semplice per il compito da svolgere. Eccone uno per te: qual è il modo più semplice per calcolare i momenti di una distribuzione di Poisson? Direi che è di usare nuovamente una tecnica diversa, la funzione generatrice di probabilitàG(t)=EtX=expλ(t1). Quindi il simbolo di Pochhammer che cade(X)kE(X)k=G(k)(1)=λk. In generale, di solito vale la pena usare PGF per distribuzioni discrete, MGF per distribuzioni continue che sono limitate o hanno un decadimento superexponenziale nelle code del PDF e la funzione caratteristica quando ne hai davvero bisogno.

E a seconda della domanda che stai ponendo, potresti invece trovare prudente utilizzare la funzione di generazione cumulativa, sia essa definita come il logaritmo di MGF o CF. Ad esempio, lascerò come esercizio la definizione log-MGF di cumulativi per il massimo din Exp(1) iids dà κm=(m1)!k=1nkm, che fornisce un calcolo molto più semplice della media e della varianza (rispettivamente κ1 e κ2) che se le avessi scritte in termini di momenti.


2
Non capisco la tua osservazione sull'integrazione ic+R,"perché afaik il cf è definito come un integrale di una funzione a valore complesso su R. Non deve essere visto come integrale di contorno. Per quelli a disagio con numeri complessi può comunque essere visto come una coppia di integrali reali. Non è chiaro come il mgf sia "più semplice" sotto ogni aspetto. In effetti, il cf è più semplice, nel senso che non ci si deve preoccupare della convergenza.
whuber

1
@whuber Quello che voglio dire è R12πexp(x22+itx)dx=it+R12πexp(y22t22)dt.
JG

Ho sospettato tanto. Ma non è solo un artefatto di come si potrebbe scegliere di valutare l'integrale, piuttosto che essere una caratteristica inerente al cf stesso?
whuber

@whuber Il problema è che molte fonti fingono che la sostituzione funzioni in modo semplice come nel caso della MGF, cosa che non accade.
JG

1
Ti dispiacerebbe elaborare un po 'il perché non lo fa? Non vedo nulla di problematico in questo caso particolare; e in generale, perché l'integrale originale è finitoRè convergente, non ci si aspetterebbe alcun problema con le sostituzioni di questo tipo.
whuber

3

Se la tua variabile casuale ha tutti i suoi momenti, allora l'MGF esiste ed è generalmente utile almeno quanto la funzione caratteristica per le prove.

Per rispondere alla tua domanda, quando MGF esiste, fornisce la base per molti calcoli di valore estremo correlati X. Il più semplice dei quali è (pert0),

P(X>r)=P(etX>etr)MX(t)/etr.

Qui, ora è possibile ridurre al minimo rhs t. Stranamente, questo limite è uno dei pochi semplici modi che conosciamo per ottenere stime su eventi rari. L'area generale di questa è la teoria delle grandi deviazioni , dove si deve fare un sacco di lavoro per ottenere limiti migliori (più stretti). Un esempio comune di questo è guardareSn=X1++Xn, in modo che quando il MGF di X1 esiste, quindi si può mostrare P(|SnE[X]|>nr) decadono esponenzialmente in n. Questo è più comunemente noto come Teorema di Cramer .

Ecco alcune note compatte su questo.


1
Tutto nel tuo primo paragrafo è già menzionato nella domanda tranne l'ultima frase, che penso sia falsa. Ad esempio, esistono tutti i momenti della distribuzione log-normale, ma il suo mgf non è definito per nessun numero reale positivo. La seconda parte della tua risposta è molto utile perché evidenzia un'applicazione di mgf che apparentemente non ha una funzione caratteristica analoga
Artem Mavrin,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.