Come spiegheresti Moment Generating Function (MGF) in parole povere?


15

Che cos'è una funzione di generazione del momento (MGF)?

Puoi spiegarlo in parole povere e con un esempio semplice e facile?

Per favore, limitare il più possibile l'uso delle notazioni matematiche formali.


1
Vuoi un esempio semplice e facile ... ma senza notazione matematica? Non sono sicuro che una cosa del genere sarebbe molto facile da fare - almeno non senza rischiare di dare un'impressione fuorviante di ciò che stai affrontando. Suppongo che uno potrebbe dare il mgf di una variabile casuale degenerata che è sempre senza aver bisogno di molto in termini di notazione matematica, ma sarà poco illuminante se vuoi davvero capire mgfs. 0
Glen_b -Restate Monica

1
Non sono sicuro che ci sia un modo intuitivo per capirlo, potresti semplicemente pensarlo come un modo per "codificare" una distribuzione (almeno quando esiste, questa idea funziona un po 'meglio con le funzioni caratteristiche).
dsaxton,

1
Una funzione generatrice di momenti - quando esiste - è un modo per codificare tutti i momenti interi non negativi di una variabile casuale in una funzione e da cui possono essere estratti di nuovo; mgfs può essere usato per fare calcoli particolari che a volte non sono così facili da fare in altri modi. Non mi aspetto che sia di grande aiuto.
Glen_b -Restate Monica

1
Sono sicuro che hai visto Joe Blitztein rispondere alla stessa domanda su Quora
Antoni Parellada,

Risposte:


18

Supponiamo che un'intuizione priva di equazioni non sia possibile, e insistiamo ancora nel ridurre la matematica agli elementi essenziali per avere un'idea di ciò che sta succedendo: stiamo cercando di ottenere i momenti statistici , che, dopo il riferimento obbligatorio alla fisica , definiamo il valore atteso di una potenza di una variabile casuale. Per una variabile casuale continua, il momento k -th grezzo è di LOTUS :

(1)E[Xk]=Xkpdfdx

La funzione generatrice del momento ,

MX(t):=E[etX],
è un modo per aggirare questo integrale (Eq.1) effettuando invece:

(2)E[etX]=etXpdfdx

Perché? Perché è più facile e c'è una fantastica proprietà della MGF che può essere vista espandendo la serie di e di MaclaurinetX

etX=1+X1!t+X22!t2+X33!t3+

Prendendo le aspettative di entrambi i lati di questa serie di potenze:

MX(t)=E[etX](3)=1+E[X]1!t+E[X2]2!t2+E[X3]3!t3+

i momenti appaiono "appollaiati" su questo "stendibiancheria" polinomiale, pronti per essere abbattuti semplicemente differenziando k volte e valutando a zero una volta che passiamo attraverso l'integrazione più semplice (in eq. (2)) solo una volta per tutti i momenti! Il fatto che si tratti di un'integrazione più semplice è più evidente quando il pdf è un esponenziale.

Per recuperare il k -esimo momento:

MX(k)(0)=dkdtkMX(t)|t=0

Il fatto che alla fine vi sia la necessità di differenziare lo rende un pranzo non gratuito - alla fine si tratta di una trasformazione di Laplace a due facce del pdf con un segno modificato nell'esponente:

L{pdf(x)}(s)=esxpdf(x)dx

tale che

(4)MX(t)=L{pdf(x)}(s).

Questo, in effetti, ci dà una via fisica per l'intuizione. La trasformazione di Laplace agisce sul pdf e lo scompone in momenti. La somiglianza con una trasformata di Fourier è inevitabile : un FT mappa una funzione su una nuova funzione sulla linea reale e Laplace mappa una funzione su una nuova funzione sul piano complesso. La trasformata di Fourier esprime una funzione o un segnale come una serie di frequenze, mentre la trasformata di Laplace risolve una funzione nei suoi momenti . In effetti, un modo diverso di ottenere momenti è attraverso una trasformata di Fourier ( funzione caratteristica ). Il termine esponenziale nella trasformata di Laplace è in generale della forma est cons=σ+iω , corrispondente allereali esponenziali e sinusoidali immaginarie, e dando trame comequesta:


[ Dalla guida dello scienziato e dell'ingegnere all'elaborazione del segnale di Steven W. Smith ]


Pertanto la funzione MX(t) decompone il pdf in qualche modo nelle sue "frequenze costituenti" quando σ=0. Dall'eq. (4):

MX(t)=E[esX]=esxpdf(x)dx=e(σ+iω)xpdf(x)dx=eσxeiωxpdf(x)dx

che ci lascia con l'integrale improprio della parte dell'espressione in rosso, corrispondente alla trasformata di Fourier del pdf.

In generale, l' intuizione dei poli di trasformazione di Laplace di una funzione sarebbe quella di fornire informazioni sui componenti esponenziali (decadimento) e di frequenza della funzione (in questo caso, il pdf).


In risposta alla domanda sotto i commenti sul passaggio da a , questa è una mossa completamente strategica: una espressione non segue dall'altra. Ecco un'analogia: abbiamo un'auto tutta nostra e siamo liberi di guidare in città ogni volta che dobbiamo occuparci di alcuni affari (leggi, integrando l'Eq non importa quanto sia difficile per ogni singolo momento separato) . Invece, possiamo fare qualcosa di completamente diverso: possiamo guidare fino alla stazione della metropolitana più vicina (leggi, risolvi l'Eq solo una volta), e da lì usa i mezzi pubblici per raggiungere ogni singolo posto che dobbiamo visitare (leggi, prendi qualsiasi derivata dell'integrale in Eq per estrarre qualunqueXketx(1)(2)k(2)k-timo momento di cui abbiamo bisogno, sapendo (grazie a Eq ) che tutti i momenti si "nascondono" lì dentro e isolati valutando a ).(3)0


2
In che modo sostituisce ? (Di punto in bianco?)E[etX]E[Xk]
user366312

2
Vorrei che i laici che capivano questa risposta fossero i miei studenti :)
Aksakal,

3

Nei termini più laici è un modo per codificare tutte le caratteristiche della distribuzione di probabilità in una breve frase. Ad esempio, se so che MGF della distribuzione è posso scoprire la media di questa distribuzione prendendo il primo termine dell'espansione di Taylor : Se sai cosa stai facendo, è molto più veloce rispetto alle aspettative della funzione di probabilità.

M(t)=etμ+1/2σ2t2
ddtM(t)|t=0=μ+σ2t|t=0=μ

Inoltre, poiché questo MGF codifica tutto sulla distribuzione, se sai come manipolare la funzione, puoi applicare le operazioni su tutte le caratteristiche della distribuzione contemporaneamente! Perché non usiamo sempre MGF? Innanzitutto, non è in ogni situazione che MGF sia lo strumento più semplice. Secondo, MGF non esiste sempre.

Sopra laico

Supponiamo di avere una distribuzione normale standard. Puoi esprimere tutto ciò che sai al riguardo dichiarando il suo PDF:

f(x)=12πex2/2

Puoi calcolare il suo momento come la deviazione media e standard e usarlo su variabili trasformate e funzioni su normali casuali ecc.

Puoi pensare al MGF della distribuzione normale come alternativa al PDF. Contiene la stessa quantità di informazioni. Ho già mostrato come ottenere la media.

Perché abbiamo bisogno di un modo alternativo? Come ho scritto, a volte è solo più conveniente. Ad esempio, prova a calcolare la varianza dello standard normale dal PDF: Non è così difficile, ma è molto più facile farlo con MGF :

σ2=x212πex2/2dx=?
M(t)=et2/2
σ2=d2dt2M(t)|t=0=ddtt|t=0=1


1
Potete per favore espandere il "tutto" che codifica sulla distribuzione?
ColorStatistics

2
Per apprezzare il punto sollevato da @ColorStatistics, consultare stats.stackexchange.com/questions/25010 .
whuber

@whuber: Grazie, whuber. Studierò quel riferimento. Questo è un argomento che sto cercando di capire meglio.
ColorStatistics

Come possiamo dimostrare che MGF e PDF contengono la stessa quantità di informazioni?
Aerin,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.