Intuizione per momenti sulla media di una distribuzione?


13

Qualcuno può fornire un'intuizione sul perché i momenti più alti di una distribuzione di probabilità , come il terzo e il quarto momento, corrispondano rispettivamente all'asimmetria e alla curtosi? In particolare, perché la deviazione rispetto alla media elevata alla terza o quarta potenza finisce per tradursi in una misura di inclinazione e curtosi? C'è un modo per mettere in relazione questo con il terzo o il quarto derivato della funzione?pX

Considera questa definizione di asimmetria e curtosi:

Skewness(X)=E[(XμX)3]/σ3,Kurtosis(X)=E[(XμX)4]/σ4.

In queste equazioni eleviamo il valore normalizzato a una potenza e prendiamo il suo valore atteso. Non mi è chiaro perché elevare la variabile casuale normalizzata alla potenza di quattro dia "picco" o perché elevare la variabile casuale normalizzata alla potenza di tre dovrebbe dare "skewness". Questo sembra magico e misterioso!(Xμ)/σ


4
La mia intuizione sull'inclinazione è di notare che il terzo potere preserva i negativi. Quindi, se si hanno deviazioni negative più grandi dalla media di quelle positive (in parole povere), si finisce con una distribuzione distorta negativa. La mia intuizione per la curtosi è che la quarta potenza amplifica grandi deviazioni dalla media molto più della seconda potenza. Questo è il motivo per cui pensiamo alla kurtosi come una misura di quanto siano grasse le code di una distribuzione. Si noti che possibilità molto grandi di x dalla media mu sono aumentate alla quarta potenza, il che le rende amplificate ma ignora il segno.
Wolfsatthedoor


1
Poiché i 4 poteri sono molto più influenzati dai valori anomali che dai poteri 1, mi aspetto che otterrai poco guardando il quarto momento sulla mediana - almeno se l'obiettivo era la robustezza.
Glen_b -Restate Monica

1
Innanzitutto, nota che questi momenti più elevati non sono necessariamente misure buone / affidabili di asimmetria / picco. Detto questo, penso che i raggi diano una buona intuizione fisica per i primi tre momenti, ad es. Media = bilanciamento / scala del raggio , varianza = flessione a sbalzo , asimmetria = altalena .
GeoMatt22

1
Hai ragione, l'interpretazione della curtosi come misurazione del "picco" è magica e misteriosa. Questo perché non è affatto vero. Kurtosis non ti dice assolutamente nulla del picco. Misura solo le code (valori anomali). È facile dimostrare matematicamente che le osservazioni vicino al picco contribuiscono in misura minuscola alla misura della curtosi, indipendentemente dal fatto che il picco sia piatto, appuntito, bimodale, sinusoidale o a campana.
Peter Westfall,

Risposte:


7

C'è una buona ragione per queste definizioni, che diventa più chiara quando si guarda la forma generale per i momenti di variabili casuali standardizzate. Per rispondere a questa domanda, in primo luogo considerare la forma generale del ° standardizzata momento centrale :n

ϕn=E[(XE[X]S[X])n ].

I primi due momenti centrali standardizzati sono i valori e , che per tutte le distribuzioni per le quali la quantità di cui sopra è ben definita. Quindi, possiamo considerare i momenti centrali standardizzati non banali che si verificano per i valori . Per facilitare la nostra analisi definiamo:ϕ1=0ϕ2=1n3

ϕn+=E[|XE[X]S[X]|n |X>E[X]]P(X>E[X]),ϕn=E[|XE[X]S[X]|n |X<E[X]]P(X<E[X]).

Questi sono quantità non negativi che conferiscono esima assoluta potenza del standardizzato condizionale variabile casuale che sia sopra o sotto il suo valore atteso. Ora scomporremo il momento centrale standardizzato in queste parti.n


I valori dispari di misurano l'inclinazione nelle code:n per qualsiasi valore dispari di abbiamo una potenza dispari nell'equazione del momento e quindi possiamo scrivere il momento centrale standardizzato come . Da questa forma si vede che il momento centrale standardizzato ci dà la differenza tra il esima potenza assoluta della variabile casuale standardizzata, subordinato al fatto di essere sopra o sotto la sua media rispettivamente.n3ϕn=ϕn+ϕnn

Pertanto, per qualsiasi potenza dispari otterremo una misura che fornisce valori positivi se la potenza assoluta prevista della variabile casuale standardizzata è maggiore per valori al di sopra della media rispetto a valori al di sotto della media e fornisce valori negativi se l'atteso la potenza assoluta è inferiore per i valori al di sopra della media rispetto ai valori al di sotto della media. Qualunque di queste quantità potrebbe ragionevolmente essere considerata come una misura di un tipo di "asimmetria", con potenze più elevate che danno un peso relativo maggiore a valori che sono lontani dalla media.n3

Poiché questo fenomeno si verifica per ogni potere dispari , la scelta naturale per una misura archetipica di "asimmetria" è definire come l' . Questo è un momento centrale standardizzato inferiore rispetto ai poteri dispari più elevati ed è naturale esplorare i momenti di ordine inferiore prima di considerare i momenti di ordine superiore. In statistica abbiamo adottato la convenzione di riferirsi a questo momento centrale standardizzato come l' asimmetria , poiché è il momento centrale standardizzato più basso che misura questo aspetto della distribuzione. (I poteri dispari più alti misurano anche i tipi di asimmetria, ma con una sempre maggiore enfasi su valori lontani dalla media.)n3ϕ3


I valori pari di misurano la gravità delle code:n per qualsiasi valore pari di abbiamo una potenza pari nell'equazione del momento e quindi possiamo scrivere il momento centrale standardizzato come . Da questa forma si vede che il momento centrale standardizzato ci dà la somma di esima potenza assoluta della variabile casuale standardizzata, subordinato al fatto di essere sopra o sotto la sua media rispettivamente.n3ϕn=ϕn++ϕnn

Pertanto, per qualsiasi potenza pari otterremo una misura che fornisce valori non negativi, con valori più alti che si verificano se le code della distribuzione della variabile casuale standardizzata sono più grasse. Si noti che questo è un risultato rispetto alla variabile casuale standardizzata , quindi un cambiamento di scala (modifica della varianza) non ha alcun effetto su questa misura. Piuttosto, è effettivamente una misura del grasso delle code, dopo aver standardizzato la varianza della distribuzione. Qualunque di queste quantità potrebbe ragionevolmente essere considerata come una misura di un tipo di "curtosi", con poteri più alti che danno un peso relativo maggiore a valori che sono lontani dalla media.n3

Poiché questo fenomeno si verifica per ogni potere uniforme , la scelta naturale per una misura archetipica della curtosi è definire come la curtosi. Questo è un momento centrale standardizzato inferiore rispetto ai poteri pari superiori ed è naturale esplorare i momenti di ordine inferiore prima di considerare i momenti di ordine superiore. In statistica abbiamo adottato la convenzione di riferirsi a questo momento centrale standardizzato come "kurtosi", poiché è il momento centrale standardizzato più basso che misura questo aspetto della distribuzione. (I poteri pari superiori misurano anche i tipi di curtosi, ma con una sempre maggiore enfasi su valori lontani dalla media.)n3ϕ4


Questa equazione è ben definita per qualsiasi distribuzione i cui primi due momenti esistono e che ha una varianza diversa da zero. Supponiamo che la distribuzione degli interessi rientri in questa classe per il resto dell'analisi.


2

Domanda simile Che cos'è il "momento" sui "momenti" di una distribuzione di probabilità? Ho dato una risposta fisica a ciò che riguardava i momenti.

"L'accelerazione angolare è la derivata della velocità angolare, che è la derivata dell'angolo rispetto al tempo, ovvero, . Considera che il secondo momento è analogo alla coppia applicata a un movimento circolare, o se acceleri / deceleri (anche la seconda derivata) di quel movimento circolare (cioè angolare, ). Analogamente, il terzo momento sarebbe essere un tasso di cambiamento di coppia, e così via e così via per momenti ancora più elevati per fare tassi di cambio di tassi di cambio di tassi di cambiamento, cioè derivati ​​sequenziali del movimento circolare .... "dωdt=α,dθdt=ωθ

Vedi il link in quanto è forse più facile visualizzarlo con esempi fisici.

L'asimmetria è più facile da capire della curtosi. Un'asimmetria negativa è una coda sinistra più pesante (o un'ulteriore direzione negativa più esterna) rispetto alla destra e un'asimmetria positiva il contrario.

Wikipedia cita Westfall (2014) e implica che l'alta kurtosi sorge sia per variabili casuali che hanno valori anomali lontani o per funzioni di densità con una o due code pesanti, sostenendo che qualsiasi tendenza centrale dei dati o della densità ha un effetto relativamente scarso sul valore della curtosi. Valori bassi di kurtosi implicherebbero il contrario, ovvero la mancanza di valori anomali dell'asse la relativa leggerezza di entrambe le code.x


L'asimmetria è il punto di equilibrio del pdf di e la curtosi è il punto di equilibrio del pdf di . Entrambe le trasformazioni "allungano" le code, la curtosi di più. Se il pdf di cade a destra quando un fulcro è posizionato su 0, allora c'è una inclinazione positiva nella distribuzione originale. Se il pdf di cade a destra quando un fulcro è posizionato su 3.0, la distribuzione originale è più pesante della distribuzione normale. Qui, "pesantezza delle code" si riferisce più precisamente alla leva finanziaria che alla massa. L'interpretazione di Moors non è del tutto giusta per entrambe le menzioni di "concentrazione". Z3Z4Z3Z4
Peter Westfall,

@PeterWestfall Sono d'accordo sul fatto che l'interpretazione di Moors sia imperfetta. Un linguaggio preciso non è facilmente raggiungibile senza essere confuso. Prendi "leva" per esempio. Leva finanziaria significa primo momento e si dovrebbe inventare qualcosa come "leva finanziaria" per il secondo momento, che potrebbe confondere più che illuminare. Il tuo approccio sembra inventare un nuovo concetto, vale a dire "leva allungata", che accenna a trasformazioni geometriche per le quali si potrebbe anche affermare alcuni sostenitori che lo favoriscono come autoconsistente al rischio di essere anche controverso e non fisico per gli altri .
Carl,

"Leva" si riferisce al primo momento della variabile , dove . Non è scienza missilistica. UU=Z4
Peter Westfall,

@PeterWestfall Non essere troppo pignolo, ma stai sfruttando la leva. Certo, puoi ancora usare la parola, e se non fosse un oggetto di quarta dimensione, rispetto a una distanza unidimensionale, , potrebbe anche essere utile. Il contesto qui è quello dei momenti e la creazione di un modello fisico per i momenti. Esistono diversi modi per fare, ad esempio, vedere la mia risposta al riguardo qui . In altre parole, per mettere momenti in qualsiasi contesto fisico, dobbiamo fare altro che agitare la mano e invocare la quarta dimensione. Z4Z
Carl,

@PeterWestfall Nel contesto del movimento circolare, chiameremmo il momento torcente del secondo momento , e non l' effetto leva di , che quest'ultimo, sebbene non sia errato, non ricorda nulla di fisico. Z2
Carl,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.