Cosa c'è di così "momento" nei "momenti" di una distribuzione di probabilità?


65

So che sono i momenti e come calcolarli e come utilizzare la funzione di generazione dei momenti per ottenere momenti di ordine superiore. Sì, conosco la matematica.

Ora che ho bisogno di lubrificare le mie conoscenze statistiche per il lavoro, ho pensato che avrei potuto anche fare questa domanda - mi ha assillato per alcuni anni e al college nessun professore conosceva la risposta o avrebbe semplicemente respinto la domanda (onestamente) .

Cosa significa in questo caso la parola "momento"? Perché questa scelta di parole? Non mi sembra intuitivo (o non l'ho mai sentito così al college :) Vieni a pensarci che sono altrettanto curioso del suo utilizzo in "momento d'inerzia";) ma per ora non ci concentriamo su questo.

Quindi cosa significa un "momento" di una distribuzione e cosa cerca di fare e perché QUESTA parola! :) Perché a qualcuno importa dei momenti? In questo momento mi sento diversamente per quel momento;)

PS: Sì, probabilmente ho fatto una domanda simile sulla varianza, ma apprezzo la comprensione intuitiva rispetto a "guardare nel libro per scoprirlo" :)


5
Per la scelta della parola, inizia con la sua etimologia .
whuber

2
@whuber: sì! Ho cercato prima di porre questa domanda - anche molti anni fa;)
Dottorato di ricerca il

Vorrei combinare l'etimologia fornita da @whuber con questo ( thefreedictionary.com/moment ) sguardo alla definizione matematica / statistica citata dal Dizionario Inglese Collins. Combinato a definizioni di uso comune come "breve periodo di tempo" o "istanza specifica". Sono abbastanza certo che quel momento nel nostro senso matematico / statistico è intercambiabile con i punti. Proprio questi punti hanno un significato particolare in alcune applicazioni (MGF o MOI) prima che la geometria e l'algebra di Cartesio non avessero alcun collegamento sistematico, quindi probabilmente avevano una varietà di termini diversi per ciò che in realtà sono la stessa cosa.
Chris Simokat,

4
Viene da Macbeth: " Chi può essere saggio, stupito, temperato e furioso, leale e neutrale, in un momento? " Macbeth: Atto ii. Sc. 3
lupi

Risposte:


63

Secondo il documento "Primo (?) Occorrenza di termini comuni nelle statistiche matematiche" di HA David, il primo uso della parola "momento" in questa situazione fu in una lettera del 1893 a Nature di Karl Pearson intitolata "Curve di frequenza asimmetriche" .

Il documento della Biometrika del 1938 di Neyman "Una nota storica sulla deduzione dei momenti del binomio di Karl Pearson" fornisce una buona sinossi della lettera e il successivo lavoro di Pearson sui momenti della distribuzione binomiale e sul metodo dei momenti. È davvero una buona lettura. Spero che tu abbia accesso a JSTOR perché non ho il tempo di dare un buon riassunto del documento (anche se lo farò questo fine settimana). Anche se menzionerò un pezzo che può dare un'idea del perché è stato usato il termine "momento". Dall'articolo di Neyman:

[Memoria di Pearson] tratta principalmente di metodi per l'approssimazione di curve di frequenza continue mediante alcuni processi che implicano il calcolo di semplici formule. Una di queste formule prese in considerazione era il "binomio punto" o il "binomio con ordinate caricate". La formula
differisce da ciò che oggi chiamiamo binomiale, vale a dire. (4), solo per un fattore , che rappresenta l'area sotto la curva continua che si desidera adattare.α

Questo è ciò che alla fine ha portato al "metodo dei momenti". Neyman ripercorre la derivazione di Pearson dei momenti binomiali nel documento sopra.

E dalla lettera di Pearson:

Procederemo ora a trovare i primi quattro momenti del sistema di rettangoli attorno a GN. Se l'inerzia di ciascun rettangolo potrebbe essere considerata concentrata lungo la sua metà verticale, dovremmo avere per il momento attorno a NG, scrivendo . d = c ( 1 + n q )sthd=c(1+nq)

Ciò suggerisce che Pearson ha usato il termine "momento" come allusione a "momento di inerzia", un termine comune in fisica.

Ecco una scansione della maggior parte della lettera di Pearson's Nature :

inserisci qui la descrizione dell'immagine

inserisci qui la descrizione dell'immagine

È possibile visualizzare l'intero articolo a pagina 615 qui .


1
Posso dare un +100 a questa risposta? ;)
Dottorato di ricerca

5
@Nupul, puoi dare +100 come ricompensa. I premi possono essere assegnati quando la domanda ha due giorni.
mpiktas,

4
@Nupul Osserva i molteplici riferimenti di Pearson alla "gravità". Chiaramente sta ragionando con un'analogia fisica. Questo fa tornare la domanda al perché la fisica usa il termine "momento" per tali cose. Credo che sia semplicemente una generalizzazione naturale dell'idea del momento d'inerzia (un secondo momento), che trovi referenziata nei collegamenti etimologici per "momento". Ecco perché l'etimologia è rilevante.
whuber

4
La fisica riconosce i momenti più alti del secondo, Nupul, e le formule sono identiche a quelle delle statistiche. Si traduce semplicemente in "densità" di un oggetto in "densità di probabilità". In effetti, la fisica ha generalizzato l'idea in quella di un momento come coefficiente di espansione di una serie di potenze in un sistema di coordinate appropriato.
whuber

3
@Nupul Non so se posso aggiungere altro oltre a quanto affermato da Whuber. Sto pensando che qualsiasi cosa al di là di ciò che ho collegato nella mia risposta e nei commenti di Whuber possa probabilmente essere affrontata più accuratamente in Physics SE . E se non è ancora abbastanza "profondo", c'è sempre la SE inglese il cui 5o tag più usato è "etimologia". Ma grande domanda! Mi è piaciuto ricercarlo e ho trovato 3 grandi lavori che non sapevo esistessero.

7

Ognuno ha il suo momento in momenti. Avevo i miei in Cumulant e nomi di momenti oltre la varianza, l'asimmetria e la curtosi , e ho trascorso un po 'di tempo a leggere questo thread gorgious.

Stranamente, non ho trovato la "menzione del momento" nel "HA David's paper. Quindi sono andato a Karl Pearson: The Scientific Life in a Statistical Age , un libro di TM Porter. E Karl Pearson e the Origins of Modern Statistics: An Elastician diventa uno statistico, per esempio ha curato una storia della teoria dell'elasticità e della forza dei materiali dalla Galilei ai giorni nostri .

Il suo background era molto ampio, ed era in particolare un professore di ingegneria ed elastico, che era coinvolto nel determinare i momenti flettenti di un arco del ponte e nel calcolare le sollecitazioni sulle dighe in muratura. Nell'elasticità, si osserva solo ciò che sta accadendo (rottura) in modo limitato. Apparentemente era interessato (dal libro di Porter):

calcolo grafico o, nella sua forma più dignitosa e matematica, statica grafica.

Dopo :

Dall'inizio della sua carriera statistica, e anche prima, ha adattato le curve usando il "metodo dei momenti". In meccanica, ciò significava abbinare un corpo complicato a un corpo semplice o astratto che aveva lo stesso centro di massa e "raggio di oscillazione", rispettivamente il primo e il secondo momento. Queste quantità corrispondevano in statistica alla media e alla diffusione o dispersione delle misurazioni intorno alla media.

E dal momento che:

Pearson si occupava di intervalli di misurazione discreti, questa era una somma piuttosto che un integrale

I momenti inerziali possono rappresentare un riassunto di un corpo in movimento: i calcoli possono essere eseguiti come se il corpo fosse ridotto a un singolo punto.

Pearson ha impostato queste cinque uguaglianze come un sistema di equazioni, che si sono combinate in uno del nono grado. Una soluzione numerica era possibile solo per approssimazioni successive. Potrebbero esserci state fino a nove soluzioni reali, sebbene nel presente caso ce ne fossero solo due. Tracciò entrambi i risultati insieme all'originale e fu generalmente soddisfatto dell'aspetto del risultato. Tuttavia, non ha fatto affidamento sull'ispezione visiva per decidere tra di loro, ma ha calcolato il sesto momento per decidere la partita migliore

Torniamo alla fisica. Un momento è una quantità fisica che tiene conto della disposizione locale di una proprietà fisica, generalmente rispetto ad un certo punto o asse ordinale (classicamente nello spazio o nel tempo). Riassume le quantità fisiche misurate a una certa distanza da un riferimento. Se la quantità non è concentrata in un singolo punto, il momento viene "mediato" su tutto lo spazio, mediante integrali o somme.

Apparentemente, il concetto di momenti può essere ricondotto alla scoperta del principio di funzionamento della leva "scoperta" da Archimede. Una delle prime occorrenze conosciute è la parola latina "momentorum" con l'attuale senso accettato (momento di un centro di rotazione). Nel 1565, Federico Commandino tradusse l'opera di Archimede (Liber de Centro Gravitatis Solidorum) come:

Il baricentro di ogni figura solida è quel punto al suo interno, attorno al quale su tutti i lati si trovano parti dello stesso momento.

o

Centrum gravitatis uniuscuiusque solidae figurae est punctum illud intra positum, circa quod undique partes aequalium momentorum

Quindi, a quanto pare, l'analogia con la fisica è piuttosto forte: da una forma fisica discreta complicata, trova quantità che la avvicinano sufficientemente, una forma di compressione o parsimonia.


6

Essendo eccessivamente semplicistici, i momenti statistici sono ulteriori descrittori di una curva / distribuzione. Conosciamo i primi due momenti e questi sono generalmente utili per distribuzioni normali continue o curve simili. Tuttavia, questi primi due momenti perdono il loro valore informativo per altre distribuzioni. Pertanto, altri momenti forniscono ulteriori informazioni sulla forma / forma della distribuzione.


1
Non penso che il significato dei primi due momenti perda significato per tutte le distribuzioni non normali, ad esempio il tempo di permanenza medio è generalmente il primo momento o la media integrale dei tempi in una serie temporale.
Carl,

5

Domanda: Cosa significa in questo caso la parola "momento"? Perché questa scelta di parole? Non mi sembra intuitivo (o non l'ho mai sentito così al college :) Vieni a pensarci che sono altrettanto curioso del suo utilizzo in "momento d'inerzia";) ma per ora non ci concentriamo su questo.

Risposta: In realtà, in un senso storico, il momento di inerzia è probabilmente da dove proviene il senso della parola momenti. In effetti, si può (come di seguito) mostrare come il momento di inerzia sia correlato alla varianza. Ciò produce anche un'interpretazione fisica dei momenti più elevati.

In fisica, un momento è un'espressione che coinvolge il prodotto di una distanza e una quantità fisica, e in questo modo spiega come la quantità fisica è localizzata o organizzata. I momenti sono generalmente definiti rispetto a un punto di riferimento fisso; trattano quantità fisiche misurate a una certa distanza da quel punto di riferimento. Ad esempio, il momento della forza che agisce su un oggetto, spesso chiamato coppia, è il prodotto della forza e della distanza da un punto di riferimento, come nell'esempio seguente.

inserisci qui la descrizione dell'immagine

Meno confusi dei nomi di solito dati , ad esempio, iperflatilità ecc. Per i momenti più elevati sarebbero i momenti del movimento circolare, ad esempio i momenti di inerzia per il movimento circolare , dei corpi rigidi che è una semplice conversione. L'accelerazione angolare è la derivata della velocità angolare, che è la derivata dell'angolo rispetto al tempo, ovvero, . Considera che il secondo momento è analogo alla coppia applicata a un movimento circolare, o se si avrà un'accelerazione / decelerazione (anche seconda derivata) di quella circolare (cioè, angolare,dωdt=α,dθdt=ωθ) movimento. Allo stesso modo, il terzo momento sarebbe un tasso di variazione della coppia, e così via e così via per momenti ancora più elevati per fare velocità di variazione di velocità di variazione di velocità di variazione, cioè derivate sequenziali del moto circolare. Questo è forse più facile da visualizzare con esempi concreti.

Esistono limiti alla plausibilità fisica, ad esempio, quando un oggetto inizia e finisce, ovvero il suo supporto, che rende il confronto più o meno realistico. Prendiamo l'esempio di una distribuzione beta, che ha un supporto (finito) su [0,1] e mostriamo la corrispondenza per quello. La funzione di densità di distribuzione beta ( pdf ) è dove e è la funzione gamma , .

β(x;α,β)={xα1(1x)β1B(α,β)0<x<10True,
B(α,β)=Γ(α)Γ(β)Γ(α+β)Γ(.)Γ(z)=0xz1exdx

La media è quindi il primo momento di rotazione attorno alla -axis per la beta funzione tracciato come un foglio sottile rigidamente rotante della densità superficie uniforme con il minimo -value apposta sul (0,0,0) origine, con la sua base nel piano . come illustrato per , ovvero, , di seguito zxx,y

μ=01rβ(r;α,β)dr=αα+β,
β(r;2,2)μ=12inserisci qui la descrizione dell'immagine

Si noti che nulla ci impedisce di spostare il foglio sottile di distribuzione beta in un'altra posizione e ridimensionarlo, ad esempio da a , o modificare la forma verticale, ad esempio per essere una pagaia piuttosto che una gobba.0r12r4

Per calcolare la varianza della distribuzione beta, calcoleremmo il momento di inerzia per una distribuzione beta spostata con la media del valore posizionata sull'asse di rotazione, che per , cioè , dove il momento d'inerzia, assomiglia a questo,rzβ ( r ; 2 , 2 ) I = σ 2 = 1

σ2=01(rμ)2β(r;α,β)dr=αβ(α+β)2(α+β+1),
β(r;2,2) II=σ2=120I

inserisci qui la descrizione dell'immagine

Ora, per i cosiddetti momenti "centrali" più elevati , cioè i momenti relativi alla media, come l'asimmetria e la curtosi, calcoliamo il momento attorno alla media da Questo può anche essere inteso come la derivata del movimento circolare.1 0 ( r - μ ) n β ( r ; α , β )nthn th

01(rμ)nβ(r;α,β)dr.
nth

Cosa succede se vogliamo calcolare all'indietro, cioè prendere un oggetto solido 3D e trasformarlo in una funzione di probabilità? Le cose poi diventano un po 'più complicate. Ad esempio, prendiamo un toro . inserisci qui la descrizione dell'immagine

Prima prendiamo la sua sezione trasversale circolare, quindi la trasformiamo in una mezza ellisse per mostrare la densità di qualsiasi moneta piatta come una fetta, quindi convertiamo la moneta in una moneta a forma di cuneo per tenere conto della densità crescente con l'aumentare della distanza ( ) dall'asse e infine normalizziamo l'area per far funzionare una densità. Questo è illustrato graficamente di seguito con la matematica lasciata al lettore.zrz

inserisci qui la descrizione dell'immagine

Infine, chiediamo in che modo queste equivalenze si collegano al movimento? Si noti che come sopra il momento di inerzia, , può essere reso correlato al secondo momento centrale, , AKA, la varianza. Quindi , ovvero il rapporto tra la coppia, e l'accelerazione angolare, . Dovremmo quindi differenziarci per ottenere tassi di variazione degli ordini più elevati nel tempo.σ 2 I = τIσ2 τaI=τaτa


La connessione tra momenti e derivati ​​è oscura. (Esiste sicuramente, ma la relazione di solito viene rivelata attraverso la Trasformata di Fourier.) Potresti mostrare esplicitamente come e perché i momenti possono essere interpretati come derivati? Come funziona?
whuber

@whuber Più tardi, nel frattempo guarda i momenti sopra link, mostra ||.
Carl

Grazie. Vedo quella pagina e ottengo un barlume di ciò a cui ti riferisci, ma la connessione con i momenti di una distribuzione non è chiara. Sono incuriosito e attendo con ansia la tua ulteriore elaborazione di questa idea.
whuber

@whuber Dai un'occhiata e vedi se sei d'accordo.
Carl,

2
Sì, ciò può essere fatto. Quando l'argomento della serie è scritto come hai una serie di Fourier. Inoltre, la connessione tra momenti e derivati ​​è esplicita nella trasformata di Fourier: l'operatore di differenziazione viene trasformato in moltiplicazione per , mostrando direttamente come i momenti sono collegati a derivati ​​dello stesso ordine. x = e i q qxx=eiqq
whuber
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.