Penso che la mediana significhi.
È questo il caso?
Penso che la mediana significhi.
È questo il caso?
Risposte:
È una domanda non banale (sicuramente non banale come sembra pensare la gente che pone la domanda).
La difficoltà è in definitiva causata dal fatto che non sappiamo veramente cosa intendiamo per "asimmetria" - molte volte è abbastanza ovvio, ma a volte non lo è. Data la difficoltà di individuare ciò che intendiamo per "posizione" e "diffusione" in casi non banali (ad esempio, la media non è sempre ciò che intendiamo quando parliamo di posizione), non dovrebbe essere una grande sorpresa che una più sottile il concetto come l'asimmetria è almeno altrettanto scivoloso. Quindi questo ci porta a provare varie definizioni algebriche di ciò che intendiamo, e non sempre sono d'accordo l'una con l'altra.
1) Se si misura l'asimmetria in base al secondo coefficiente di asimmetria di Pearson , la media ( ) sarà inferiore alla mediana ( - cioè in questo caso la si ha al contrario).∼ μ
La (popolazione) seconda inclinazione di Pearson è e sarà negativa ("skew sinistro") quando .μ < ∼ μ
Le versioni di esempio di queste statistiche funzionano in modo simile.
La ragione della relazione necessaria tra media e mediana in questo caso è perché è così che viene definita la misura dell'asimmetria.
Ecco una densità inclinata a sinistra (sia dalla seconda misura di Pearson sia dalla misura più comune in (2) di seguito):
La mediana è contrassegnata nel margine inferiore in verde, la media in rosso.
Quindi mi aspetto che la risposta che vogliono che tu dia è che la media è inferiore alla mediana. Di solito è il caso del tipo di distribuzione a cui tendiamo a dare un nome.
(Ma continua a leggere e scopri perché in realtà non è corretto come affermazione generale.)
2) Se lo si misura in base al terzo momento standardizzato più usuale , allora spesso, ma non sempre, la media sarà inferiore alla mediana.
Cioè, è possibile costruire esempi in cui è vero il contrario o in cui una misura di asimmetria è zero mentre l'altra è diversa da zero.
Vale a dire, non c'è alcuna relazione necessaria tra le posizioni della media, della mediana e dell'asimmetria del momento.
Si consideri, ad esempio, il seguente esempio (lo stesso esempio può essere costruito come una distribuzione di probabilità discreta):
2.7 15.0 15.0 15.0 30.0 30.0
mean: 17.95
median: 15
Eppure il coefficiente di disallineamento (Fisher, terzo momento) è negativo (cioè, per le sue luci, abbiamo dati di inclinazione a sinistra) poiché la somma dei cubi delle deviazioni dalla media è negativa.
Quindi in quel caso, inclinato a sinistra, ma significa> mediana.
(D'altra parte, se si cambia 2.7 nell'esempio sopra a 3, allora si ha un esempio in cui l'asimmetria del momento è zero, ma la media supera la mediana. Se la si fa 3.3, allora l'asimmetria del momento è positiva e la media supera la mediana, ovvero è finalmente nella direzione "anticipata".)
Se si utilizza la prima asimmetria di Pearson anziché una delle definizioni precedenti, si ha un problema simile a questo caso: la direzione dell'asimmetria non stabilisce la relazione tra media e mediana in generale.
Modifica: in risposta a una domanda nei commenti - un esempio in cui media e mediana sono uguali, ma l'asimmetria del momento è negativa. Considera i seguenti dati (come in precedenza, conta anche come esempio per una popolazione discreta; considera di scrivere i numeri sulle facce di un dado).
1 5 6 6 8 10
la media e la mediana sono entrambe 6, ma la somma dei cubi di deviazioni dalla media è negativa, quindi l'asimmetria del terzo momento è negativa.
No. I dati inclinati a sinistra hanno una coda lunga a sinistra (estremità bassa), quindi la media sarà generalmente inferiore alla mediana. (Ma vedi la risposta di @Glen_b per un'eccezione). Casualmente, penso che i dati che "sembrano" distorti avranno meno della mediana.
I dati distorti a destra sono più comuni; per esempio, reddito. Lì la media è maggiore della mediana.
Codice R.
set.seed(123) #set random seed
normdata <- rnorm(1000) #Normal data, skew = 0
extleft <- c(rep(-10, 5), rep(-20, 5)) #Some data to make skew left
alldata <- c(normdata,extleft)
library(moments)
skewness(alldata) #-6.77
mean(alldata) #-0.13
median(alldata) #-0.001