Quale "cattivo" usare e quando?


197

Quindi abbiamo media aritmetica (AM), media geometrica (GM) e media armonica (HM). La loro formulazione matematica è anche ben nota insieme ai loro esempi stereotipati associati (ad esempio, la media armonica e la sua applicazione ai problemi relativi alla "velocità").

Tuttavia, una domanda che mi ha sempre incuriosito è "come faccio a decidere quale mezzo è il più appropriato da utilizzare in un determinato contesto?" Ci deve essere almeno qualche regola empirica per aiutare a capire l'applicabilità e tuttavia la risposta più comune che ho trovato è: "Dipende" (ma da cosa?).

Questa può sembrare una domanda piuttosto banale, ma anche i testi delle scuole superiori non sono riusciti a spiegarlo: forniscono solo definizioni matematiche!

Preferisco una spiegazione inglese rispetto a una matematica - un semplice test sarebbe "lo capirà tua madre / tuo figlio?"


20
Questo forse semplifica eccessivamente ma ho sempre usato la portata e le osservazioni. Se l'intervallo è lo stesso = AM (confronta i punteggi da 0-100, a 0-100), se l'intervallo è diverso ma l'osservazione è la stessa = GM (confronta i punteggi 1-5, a 0-10), se l'intervallo è uguale ma le osservazioni sono diversi = HM (velocità di un'auto a diversi livelli, altezze di due scale, altre "tariffe").
Brandon Bertelsen,

> "Dipende" (ma da cosa?) Dipende dall'algoritmo di elaborazione dei dati.
Macson,

Non è solo una scelta di quale mezzo usare. È anche una scelta di quale serie di statistiche riassuntive per descrivere la popolazione o il processo di interesse. Non si dovrebbe pensare che tutto ciò che è necessario sia un singolo numero per descrivere qualcosa di forse di grande complessità.
JimB,

Risposte:


160

Questa risposta potrebbe avere una piega leggermente più matematica di quella che stavi cercando.

La cosa importante da riconoscere è che tutti questi mezzi sono semplicemente il mezzo aritmetico sotto mentite spoglie .

L'importante caratteristica nell'identificare quale (se esiste!) Dei tre mezzi comuni (aritmetica, geometrica o armonica) è il mezzo "giusto" è trovare la "struttura additiva" nella domanda a portata di mano.

In altre parole supponiamo che ci vengano date delle quantità astratte , che chiamerò "misurazioni", abusando in qualche modo di questo termine per motivi di coerenza. Ognuno di questi tre mezzi può essere ottenuto (1) trasformando ogni x i in qualche y i , (2) prendendo la media aritmetica e quindi (3) ritornando alla scala di misura originale.x1,x2,,xnxiyi

Media aritmetica : Ovviamente, usiamo la trasformazione "identità": . Quindi, i passaggi (1) e (3) sono banali (non si fa nulla) e ˉ x A M = ˉ y .yi=xiox¯AM=y¯

Media geometrica : qui la struttura additiva si trova sui logaritmi delle osservazioni originali. Quindi, prendiamo e quindi per ottenere il GM nel passaggio (3) riconvertiamo tramite la funzione inversa del log , cioè ˉ x G M = exp ( ˉ y ) .yi=logxiceppoX¯solM=exp(y¯)

Media armonica : qui la struttura additiva è sui reciproci delle nostre osservazioni. Quindi, , da cui ˉ x H M = 1 / ˉ y .yio=1/XioX¯HM=1/y¯

In problemi fisici, questi spesso sorgono attraverso il seguente processo: Abbiamo qualche quantità che rimane fisso in relazione alle nostre misurazioni x 1 , ... , x n e alcune altre grandezze, dicono z 1 , ... , z n . Ora, giochiamo al seguente gioco: Mantieni w e z 1 + + z n costanti e proviamo a trovare alcuni ˉ x tali che se sostituiamo ciascuna delle nostre singole osservazioni x i con ˉ xwX1,...,Xnz1,...,znwz1++znX¯XioX¯, quindi viene mantenuta la relazione "totale" .

L'esempio di distanza-velocità-tempo sembra essere popolare, quindi usiamolo.

Distanza costante, tempi variabili

Considera una distanza fissa percorsa . Supponiamo ora di percorrere questa distanza n volte diverse a velocità v 1 , ... , v n , prendendo i tempi t 1 , ... , t n . Ora giochiamo al nostro gioco. Si supponga di voler sostituire i nostri velocità individuali con una certa velocità fissa ˉ v tale che il tempo totale rimane costante. Nota che abbiamo d - v i t i = 0dnv1,...,vnt1,,tnv¯ modo chei ( d - v i t i ) = 0 . Vogliamo che questototalerapporto (tempo totale e la distanza totale percorsa) conservato quando sostituiamo ciascuno dei v i da ° v nel nostro gioco. Quindi, n d - ˉ v i t i = 0

d-viotio=0,
Σio(d-viotio)=0viov¯ E dal momento che ogni t i = d / v I , otteniamo che ˉ v = n
nd-v¯Σiotio=0,
tio=d/vio
v¯=n1v1++1vn=v¯HM.

Si noti che la "struttura additiva" qui è rispetto ai singoli tempi e le nostre misurazioni sono inversamente correlate ad esse, quindi si applica la media armonica.

Distanze variabili, tempo costante

Ora cambiamo la situazione. Supponiamo che per istanze viaggiamo un tempo fisso t a velocità v 1 , ... , v n su distanze d 1 , ... , d n . Ora vogliamo conservare la distanza totale. Abbiamo d i - v i t = 0ntv1,...,vnd1,...,dn E il sistema totale si conserva se Σ i ( d i - v i t ) = 0 . Ripetendo il nostro gioco, cerchiamo un ˉ v tale che i ( d i - ˉ v t ) = 0

dio-viot=0,
Σio(dio-viot)=0v¯ ma, poiché d i = v i t , otteniamo che ˉ v = 1
Σio(dio-v¯t)=0,
dio=viot
v¯=1nΣiovio=v¯UNM.

Qui la struttura additiva che stiamo cercando di mantenere è proporzionale alle misurazioni che abbiamo, quindi si applica la media aritmetica.

Cubo di uguale volume

nV

V=X1X2Xn,
nXioX¯
V=X¯X¯X¯=X¯n.

X¯=(XioXn)1/n=X¯solM

ceppoV=ΣioceppoXio

Nuovi mezzi dai vecchi

dioviotiov¯

Esercizio : Qual è il significato "naturale" in questa situazione?


25
+1 Questa è un'ottima risposta. Tuttavia, penso che sia incompleto in un modo importante: in molti casi il giusto mezzo da utilizzare è determinato dalla domanda a cui stiamo cercando di rispondere piuttosto che da qualsiasi struttura matematica nei dati. Un buon esempio di ciò si verifica nella valutazione del rischio ambientale: le autorità di regolamentazione vogliono stimare l'esposizione totale di una popolazione ai contaminanti nel tempo. Ciò richiede una media aritmetica adeguatamente ponderata, anche se i dati di concentrazione ambientale di solito hanno una struttura moltiplicativa . La media geometrica sarebbe lo stimatore o stimatore sbagliato.
whuber

7
@whuber: (+1) Questo è un commento eccellente. Nel mio cammino verso la costruzione di una risposta, ho preso un fork decisamente non statistico, quindi sono contento che tu l'abbia menzionato. È un argomento degno di una risposta completa ( suggerimento ).
cardinale il

9
@whuber: porta anche al fatto (forse involontariamente) che l'analisi statistica può spesso essere soggetta alla supervisione di esperti di dominio (o, forse nel tuo esempio, anche non esperti), che vogliono stimare qualcosa di significativo per il loro dominio ma quasi statisticamente totalmente innaturale. Il problema che ho incontrato in passato è che a volte vogliono anche dettare il modo in cui viene effettuata la stima statistica! :)
cardinale il

1
@whuber: Sarebbe molto apprezzato se tu potessi aggiungere quel punto di vista anche alla risposta, con qualche elaborazione. Onestamente, le tue spiegazioni sono tra le migliori che abbia mai visto su Stats.SE!
Dottorato di ricerca

3
Il solito grande commento di @whuber. A volte (forse spesso!) Il mezzo giusto da usare è nessuno ; piuttosto, la domanda deve spesso essere estesa a "quale misura di tendenza centrale dovrei usare?".
Peter Flom

43

Espandendo l'eccellente commento di @Brandon (a cui penso che dovrebbe essere promosso per rispondere):

La media geometrica dovrebbe essere usata quando sei interessato a differenze moltiplicative. Brandon osserva che la media geometrica dovrebbe essere utilizzata quando le gamme sono diverse. Questo di solito è corretto. Il motivo è che vogliamo uniformare gli intervalli. Ad esempio, supponiamo che i candidati al college siano classificati in base al punteggio SAT (da 0 a 800), alla media dei voti in HS (da 0 a 4) e alle attività extracurricolari (da 1 a 10). Se un college volesse fare una media di questi ed equilibrare gli intervalli (ovvero, aumenti di peso in ogni qualità rispetto all'intervallo), la media geometrica sarebbe la strada da percorrere.

Ma questo non è sempre vero quando abbiamo scale con intervalli diversi. Se stessimo confrontando il reddito in diversi paesi (compresi quelli poveri e ricchi), probabilmente non vorremmo la media geometrica, ma la media aritmetica (o, più probabilmente, la media o forse una media ridotta).

L'unico uso che ho visto per la media armonica è quello di confrontare i tassi. Ad esempio: se guidi da New York a Boston a 40 miglia orarie e ritorni a 60 miglia orarie, la tua media complessiva non è la media aritmetica di 50 miglia orarie, ma la media armonica.

(40+60)/2=502/(1/40+1/60)=48

240/5=48


3
Perché il tuo esempio SAT / GPA / extracurriculare dovrebbe usare una media geometrica piuttosto che una media aritmetica ponderata o scalata? Perché un SAT o GPA pari a zero dovrebbe significare che gli altri due valori diventano irrilevanti (come implicherebbe una media geometrica)? E se (diciamo) le attività extracurricolari tendono a raggrupparsi in una banda molto più ristretta rispetto al suo intervallo teorico? Sembra che avrebbe più senso prendere una media aritmetica di percentili (o altri valori adeguati) che una media geometrica di valori grezzi.
ruakh,

1
@ruakh Interessante. In questo caso il problema 0 non ha molta importanza, dato che SAT e GPA non possono davvero essere 0 (SAT = 0 è quasi impossibile e GPA di 0 non si laureerebbe). Penso che una media aritmetica dei percentili sarà vicina alla media geometrica nelle sue conclusioni (anche se non nei numeri reali).
Peter Flom

31

Proverò a ridurlo a 3-4 regole pratiche e fornirò alcuni altri esempi dei mezzi pitagorici.

La relazione tra i 3 mezzi è HM <GM <AM per i dati non negativi con alcune variazioni . Saranno uguali se e solo se non vi è alcuna variazione nei dati di esempio.

Per i dati nei livelli, utilizzare AM. I prezzi sono un buon esempio. Per i rapporti, utilizzare GM. I rendimenti degli investimenti, i prezzi relativi come l'indice Bloomberg Billy (il prezzo della libreria Billy di Ikea in vari paesi rispetto al prezzo USA) e l'indice di sviluppo umano delle Nazioni Unite sono tutti esempi. HM è appropriato quando si tratta di tariffe. Ecco un esempio non automobilistico per gentile concessione di David Giles :

Ad esempio, considerare i dati su "ore lavorate a settimana" (una tariffa). Supponiamo di avere quattro persone (osservazioni di esempio), ognuna delle quali lavora per un totale di 2.000 ore. Tuttavia, lavorano per diversi numeri di ore alla settimana, come segue:

Person      Total Hours       Hours per Week          Weeks Taken
1                  2,000                  40                   50
2                  2,000                  45                   44.4444
3                  2,000                  35                   57.142857
4                  2,000                  50                   40

Total:           8,000                                       191.587297

La media aritmetica dei valori nella terza colonna è AM = 42,5 ore alla settimana. Tuttavia, nota cosa implica questo valore. Dividendo il numero totale di settimane lavorate dai membri del campione (8.000) per questo valore medio si ottiene un valore di 188.2353 come il numero totale di settimane lavorate da tutte e quattro le persone.

Ora guarda l'ultima colonna nella tabella sopra. In effetti, il valore corretto per il numero totale di settimane lavorate dai membri del campione è 191,5873 settimane. Se calcoliamo la media armonica per i valori per Ore settimanali nella terza colonna della tabella otteniamo HM = 41.75642 ore (<AM) e dividere questo numero in 8.000 ore ci dà il risultato corretto di 191.5873 per il numero totale di settimane lavorate. Ecco un caso in cui la media armonica fornisce la misura appropriata per la media del campione.

David discute anche della versione ponderata dei 3 mezzi, che emerge dagli indici dei prezzi utilizzati per misurare l'inflazione.

A Hijacky Da parte:

Questi ROT non sono perfetti. Ad esempio, spesso trovo difficile capire se qualcosa è un tasso o un rapporto. I rendimenti di un investimento sono generalmente considerati come un rapporto quando si calcolano le medie, ma sono anche un tasso poiché sono generalmente denominati in "x% per unità di tempo". "Usare l'HM quando i dati sono livelli per unità di tempo" sarebbe un'euristica migliore?

Se volessi riassumere il Big Mac Index per i paesi del Nord Europa, useresti il ​​GM?


3
Un paio d'anni in ritardo, ma hai mai trovato una risposta alla tua domanda riguardo: "Se volessi riassumere il Big Mac Index per i paesi del Nord Europa, useresti il ​​GM?" ?
StatsScared

2
@StatsScared No, ma sarebbe una bella domanda!
Dimitriy V. Masterov,

7

Una possibile risposta alla tua domanda ("come faccio a decidere quale media è la più appropriata da utilizzare in un determinato contesto?") È la definizione di media data dal matematico italiano Oscar Chisini .

Ecco un documento con una spiegazione più dettagliata e alcuni esempi (velocità di marcia media e altri).


6
Potrebbe essere l'ideale se potessi aggiungere alcune righe sulla definizione di Chisini qui nel caso in cui il link si interrompa, e / o aiutare i lettori a sapere se vogliono fare clic sul link per perseguire ulteriormente le idee.
gung

2
In effetti, il collegamento al documento è morto. Il link Wolfram non fornisce alcuna idea di come la definizione di Chisini sia utile per determinare quale mezzo utilizzare in un determinato contesto; mi sembra solo una generalizzazione matematica rispetto a una prescrizione d'uso.
Ryan Simmons,

1
Utilizzando il DOI, si può vedere che il documento è stato spostato su tandfonline.com. Citazione: R Graziani, P Veronese (2009). Come calcolare una media? L'approccio Chisini e le sue applicazioni. The American Statistician 63 (1), pagg. 33-36. tandfonline.com/doi/abs/10.1198/tast.2009.0006
akraf

0

Penso che un modo semplice per rispondere alla domanda sarebbe:

  1. Se la struttura matematica è xy = k (una relazione inversa tra variabili) e stai cercando una media, allora devi usare la media armonica - che equivale a una media aritmetica ponderata - considera

Media armonica = 2ab / (a ​​+ b) = a (b / a + b) + b (a / (a ​​+ b)

Ad esempio: la media del costo in dollari rientra in questa categoria perché la quantità di denaro che stai investendo (A) rimane fissa, ma il prezzo per azione (P) e il numero di azioni (N) variano (A = PN). Infatti, se si considera una media aritmetica come un numero equamente centrato tra due numeri, anche la media armonica è un numero equamente centrato tra due numeri ma (e questo è carino) il "centro" è dove sono le percentuali (rapporti) pari. Cioè: (x - a) / a = (b -x) / b, dove x è la media armonica.

  1. Se la struttura matematica è una variazione diretta y = kx, si utilizza la media aritmetica, che è ciò a cui la media armonica si riduce in questo caso.

1
$x$X\frac{a}{b}un'B

Diciamo che vuoi unire in media le probabilità di diversi modelli. In tal caso ha mai senso usare mezzi geometrici o armonici?
thecity2
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.