Spesso i testi statistici introduttivi applicati distinguono la media dalla mediana (spesso nel contesto delle statistiche descrittive e motivando la sintesi della tendenza centrale usando la media, la mediana e la modalità) spiegando che la media è sensibile ai valori anomali nei dati campione e / o a distribuzioni demografiche distorte, e questo è usato come giustificazione per un'affermazione secondo cui la mediana deve essere preferita quando i dati non sono simmetrici.
Per esempio:
La migliore misura della tendenza centrale per un dato insieme di dati dipende spesso dal modo in cui i valori sono distribuiti .... Quando i dati non sono simmetrici, la mediana è spesso la migliore misura della tendenza centrale. Poiché la media è sensibile alle osservazioni estreme, viene tirata nella direzione dei valori dei dati periferici e, di conseguenza, potrebbe finire per essere eccessivamente gonfiata o eccessivamente sgonfiata. "
—Pagano and Gauvreau, (2000) Principles of Biostatistics , 2nd ed. (P&G erano a portata di mano, BTW, non li distinguevano di per sé .)
Gli autori definiscono la "tendenza centrale" in questo modo: "La caratteristica più comunemente studiata di un insieme di dati è il suo centro, o il punto su cui le osservazioni tendono a raggrupparsi".
Questo mi sembra un modo meno che schietto di dire usare solo la mediana, punto , perché usare la media solo quando i dati / le distribuzioni sono simmetrici è la stessa cosa che dire usa la media solo quando è uguale alla mediana. Modifica: whuber sottolinea giustamente che sto combinando solide misure di tendenza centrale con la mediana. Quindi è importante tenere presente che sto discutendo l'inquadramento specifico della media aritmetica rispetto alla mediana nelle statistiche introduttive applicate (dove, a parte la modalità, altre misure di tendenza centrale non sono motivate).
Piuttosto che giudicare l'utilità della media in base a quanto si discosta dal comportamento della mediana, non dovremmo semplicemente comprenderle come due diverse misure di centralità? In altre parole, essere sensibili all'asimmetria è una caratteristica del mezzo. Si potrebbe anche validamente affermare che "bene la mediana non va bene perché è in gran parte insensibile all'asimmetria, quindi usala solo quando è uguale alla media".
(La modalità è abbastanza ragionevole non essere coinvolto in questa domanda.)