Nei dati distorti a sinistra, qual è la relazione tra media e mediana?


12

Penso che la mediana significhi.

È questo il caso?


2
Quale corso MOOC aperto è quello? Quali sono i materiali del corso che suggeriscono che la risposta dovrebbe essere?
Glen_b


1
Grazie, almeno un po 'di contesto, anche se tutto ciò che rimane sono letture settimanali che non chiariscono molto questo problema. Mi chiedo che cosa abbia dovuto dire il corso sull'argomento.
Glen_b

Risposte:


16

È una domanda non banale (sicuramente non banale come sembra pensare la gente che pone la domanda).

La difficoltà è in definitiva causata dal fatto che non sappiamo veramente cosa intendiamo per "asimmetria" - molte volte è abbastanza ovvio, ma a volte non lo è. Data la difficoltà di individuare ciò che intendiamo per "posizione" e "diffusione" in casi non banali (ad esempio, la media non è sempre ciò che intendiamo quando parliamo di posizione), non dovrebbe essere una grande sorpresa che una più sottile il concetto come l'asimmetria è almeno altrettanto scivoloso. Quindi questo ci porta a provare varie definizioni algebriche di ciò che intendiamo, e non sempre sono d'accordo l'una con l'altra.

1) Se si misura l'asimmetria in base al secondo coefficiente di asimmetria di Pearson , la media ( ) sarà inferiore alla mediana ( - cioè in questo caso la si ha al contrario).μμμ

La (popolazione) seconda inclinazione di Pearson è e sarà negativa ("skew sinistro") quando .μ < μ

3(μμ)σ,
μ<μ

Le versioni di esempio di queste statistiche funzionano in modo simile.

La ragione della relazione necessaria tra media e mediana in questo caso è perché è così che viene definita la misura dell'asimmetria.

Ecco una densità inclinata a sinistra (sia dalla seconda misura di Pearson sia dalla misura più comune in (2) di seguito):

inserisci qui la descrizione dell'immagine

La mediana è contrassegnata nel margine inferiore in verde, la media in rosso.

Quindi mi aspetto che la risposta che vogliono che tu dia è che la media è inferiore alla mediana. Di solito è il caso del tipo di distribuzione a cui tendiamo a dare un nome.

(Ma continua a leggere e scopri perché in realtà non è corretto come affermazione generale.)


2) Se lo si misura in base al terzo momento standardizzato più usuale , allora spesso, ma non sempre, la media sarà inferiore alla mediana.

Cioè, è possibile costruire esempi in cui è vero il contrario o in cui una misura di asimmetria è zero mentre l'altra è diversa da zero.

Vale a dire, non c'è alcuna relazione necessaria tra le posizioni della media, della mediana e dell'asimmetria del momento.

Si consideri, ad esempio, il seguente esempio (lo stesso esempio può essere costruito come una distribuzione di probabilità discreta):

  2.7 15.0 15.0 15.0 30.0 30.0

mean: 17.95
median: 15

Eppure il coefficiente di disallineamento (Fisher, terzo momento) è negativo (cioè, per le sue luci, abbiamo dati di inclinazione a sinistra) poiché la somma dei cubi delle deviazioni dalla media è negativa.

Quindi in quel caso, inclinato a sinistra, ma significa> mediana.

(D'altra parte, se si cambia 2.7 nell'esempio sopra a 3, allora si ha un esempio in cui l'asimmetria del momento è zero, ma la media supera la mediana. Se la si fa 3.3, allora l'asimmetria del momento è positiva e la media supera la mediana, ovvero è finalmente nella direzione "anticipata".)

Se si utilizza la prima asimmetria di Pearson anziché una delle definizioni precedenti, si ha un problema simile a questo caso: la direzione dell'asimmetria non stabilisce la relazione tra media e mediana in generale.


Modifica: in risposta a una domanda nei commenti - un esempio in cui media e mediana sono uguali, ma l'asimmetria del momento è negativa. Considera i seguenti dati (come in precedenza, conta anche come esempio per una popolazione discreta; considera di scrivere i numeri sulle facce di un dado).

 1  5  6  6  8 10

la media e la mediana sono entrambe 6, ma la somma dei cubi di deviazioni dalla media è negativa, quindi l'asimmetria del terzo momento è negativa.


1
@Peter Mi dispiace per la risposta lenta, ero impegnato a costruire solo questi esempi e non ho visto la tua domanda.
Glen_b -Restate Monica

2
Ho visto molte definizioni di libri di testo e nessuno ha menzionato questo. Freddo.
Peter Flom - Ripristina Monica

6
@Peter Sfortunatamente, molti libri di testo elementari ripetono semplicemente informazioni errate da altri libri di testo senza fare alcuna vera indagine da soli, e così viene propagata un'errata idea di base. I controesempi sono, come vedi, relativamente facili da costruire (li faccio solo a mano se necessario). Kendall e Stuart ( teoria avanzata della statistica, volume I - non lasciatevi scoraggiare dal titolo, è abbastanza leggibile), almeno la terza e la quarta edizione, hanno buone informazioni. Le edizioni più recenti sono di Stuart e Ord. In realtà ho pubblicato questo problema su CV diverse volte.
Glen_b

4
I binomi e mostrano che media mediana è perfettamente coerente con l'asimmetria. Un punto su questo esempio è che nessuno può convincerlo in modo convincente come oscuro o patologico. ( 5(5k)0.8k0.25k=(5k)0.2k0.85k=
Nick Cox,

1
@Nick Sì, i binomi con media intera sono ottimi esempi.
Glen_b

5

No. I dati inclinati a sinistra hanno una coda lunga a sinistra (estremità bassa), quindi la media sarà generalmente inferiore alla mediana. (Ma vedi la risposta di @Glen_b per un'eccezione). Casualmente, penso che i dati che "sembrano" distorti avranno meno della mediana.

I dati distorti a destra sono più comuni; per esempio, reddito. Lì la media è maggiore della mediana.

Codice R.

set.seed(123)  #set random seed
normdata <- rnorm(1000) #Normal data, skew = 0
extleft <- c(rep(-10, 5), rep(-20, 5)) #Some data to make skew left
alldata <- c(normdata,extleft)

library(moments)
skewness(alldata) #-6.77
mean(alldata) #-0.13
median(alldata) #-0.001

La media può mai essere uguale alla mediana?
Kunjan Kshetri,

unj2 Ho aggiunto un esempio alla mia risposta in cui l'asimmetria del terzo momento è negativa ma media = mediana.
Glen_b
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.