Perché non usiamo la media aritmetica ponderata invece della media armonica?


12

Mi chiedo quale sia un valore intrinseco nell'uso della media armonica (ad esempio per calcolare le misure F), al contrario della media aritmetica ponderata nel combinare precisione e richiamo? Sto pensando che la media aritmetica ponderata potrebbe svolgere il ruolo di media armonica o mi sto perdendo qualcosa?


9
La media armonica è una media aritmetica ponderata: ogni ha un peso proporzionale a . Xio1/Xio2
whuber

Puoi dire di più su come precisione e richiamo si combinano in questo modo?
AdamO,

6
@whuber Non sono sicuro che il tuo commento sia serio o ironico. Si presume che i pesi siano una funzione dell'indice di campionamento , non del valore del campione . Altrimenti ogni media è una media aritmetica ponderata
Luis Mendo,

2
@Luis La verità sta nel mezzo. L'indice di campionamento spesso non ha significato. I pesi sono funzioni degli oggetti, ma quelle funzioni in genere non dipendono dai valori mediati. Esempi sono i pesi associati ai tempi (EWMA), alla posizione (come nelle misure di correlazione spaziale), al grado (come nel test di Shapiro-Wilk) e alle probabilità di campionamento. Ma non tutti i mezzi sono AM ponderati: il GM non lo è, per esempio. Dato che Filippa chiede del "valore strumentale", è sembrato germano sottolineare la relazione matematica tra la media armonica e la media ponderata.
whuber

Risposte:


18

In generale, si preferiscono i mezzi armonici quando si cerca di calcolare la media, anziché i numeri interi. Nel caso di una misura F1, una media armonica penalizzerà precisioni o richiami molto piccoli, mentre la media aritmetica non ponderata non lo farà. Immagina una media del 100% e 0%: la media aritmetica è del 50% e la media armonica è dello 0%. La media armonica richiede che sia la precisione che il richiamo siano elevati.

Inoltre, quando precisione e richiamo si avvicinano, la media armonica si avvicina alla media aritmetica. Esempio: la media armonica del 95% e del 90% è del 92,4% rispetto alla media aritmetica del 92,5%.

Se questa è una proprietà desiderabile dipende probabilmente dal tuo caso d'uso, ma in genere è considerata buona.

Infine, nota che, come affermato da @whuber nei commenti, la media armonica è effettivamente una media aritmetica ponderata.


2
"I mezzi armonici sono preferiti quando si cerca di calcolare le tariffe medie" Forse se si viaggia a km a 120 km / he 10 km a 60 km / h per ottenere una velocità media complessiva di 80 km / h, anche se non se si percorrere 10 minuti a 120 km / he 10 minuti a 60 km / h per ottenere una velocità media complessiva di 90 km / h. Ma non vedo perché questo si applichi alle frazioni1012010608010120106090
Henry,

In effetti, il primo paragrafo è più un'affermazione generale sulla media armonica. Ma hai ragione, precisione e richiamo sono frazioni e non tassi. Credo che ci sia l'idea che una media aritmetica sia preferita per valori che hanno una somma interpretabile (che non si applicherebbe in questo caso), ma certamente si può prendere una media aritmetica di precisione e richiamare e produrre un risultato utile.
ilanman,

Eccellente! Sono più alla ricerca di "giustificazioni" per l'utilizzo della regola della media armonica. Ma non sono sicuro di come pensare alle giustificazioni ...
Olga,

10

La media armonica può essere un utile sostituto della media aritmetica quando quest'ultima non ha aspettative o variazioni. Può darsi che non esista o sia infinito, mentre E [ 1 / X ] esiste. Ad esempio, la distribuzione di Pareto con densità f ( x ) = α x α 0E[X]E[1/X]non ha aspettative finite quandoα1, il che implica che la media aritmetica ha aspettative infinite, mentreE[1/X]= x 0 αx α 0

f(X)=αX0αXα+1ioXX0
α1 che implica che la media armonica ha un'aspettativa finita.
E[1/X]=X0αX0αXα+2dX=αX0α(α+1)X0α+1=α(α+1)X0

Al contrario, ci sono distribuzioni per le quali la media armonica non ha aspettative, come ad esempio la distribuzione di Beta quando α 1 . E molti altri per i quali non ha variazioni.Be(α,β)α1

Esiste anche un collegamento con le approssimazioni di Monte Carlo agli integrali, e in particolare le costanti normalizzanti, basate sull'identità posteriore bayesiana

E[φ(θ)π(θ)L(θ|X)|X]=1m(X)
φ()π()L(|X)m()

2
Perché queste proprietà sono preferibili quando si calcolano i tassi medi?
Walrus the Cat,

Non conosco i risultati di ottimalità, ma avere uno stimatore con un'aspettativa limitata sembra preferibile a uno senza!
Xi'an,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.