Spiegare Media, Mediana, Modalità nei termini di Layman


10

Come spiegheresti il ​​concetto di media, mediana e modalità di un elenco di numeri e perché sono importanti per qualcuno con solo abilità aritmetiche di base? Non menzioniamo l'asimmetria, il CLT, la tendenza centrale, le loro proprietà statistiche, ecc.

Ho spiegato a qualcuno che significa che è solo un modo rapido e sporco di "riassumere" un elenco di numeri. Ma guardando indietro, questo è appena illuminante.

Qualche pensiero o esempio nel mondo reale?


Sono "tendenza centrale", alias "esito più probabile" in diversi settori. Intensità, ordine e frequenza, in particolare. Anche il mondo reale ha delle variazioni - quindi cose come la deviazione standard, l'intervallo inter-quartile (o quantile) e l'intervallo intermodale sono anche abbastanza utili perché indicano "tendenza alla variazione" o "variazione tipica nei risultati".
EngrStudent,

Puoi fare un esempio del fatto che esiste una macchina che genera numeri a caso. Raccogli tutti i numeri che genera in un elenco. Ora vuoi presentarlo ai tuoi amici senza citare tutti i numeri nell'elenco. Quindi cerchi misure che possano aiutarti a descriverlo. Media / Mediana / Modalità sono tre misure simili che forniscono informazioni sulle proprietà di base della macchina.
Kevin Pei,

@KevinPei Ma cosa significa "significa" in questo caso? Media / Mediana / Modalità non spiega molto in un esempio inventato e autonomo.
Concerned_Citizen

1
Trovare la media è un problema nel trovare il punto di articolazione che equilibra l'altalena dopo che i bambini (dello stesso peso) si sono imbarcati su di esso in numero arbitrario e in posizioni arbitrarie sulla trave. Trovare la mediana è lo stesso compito, si dice che solo i bambini si raggruppino strettamente in due posizioni su "questo" lato o "quel" lato.
ttnphns

Non puoi spiegarlo senza l'idea di distribuzione. Con solo le abilità aritmetiche di base devi disegnare immagini.
Aksakal,

Risposte:


6

Grazie per questa semplice ma profonda domanda sui concetti statistici fondamentali di media, mediana e modalità. Ci sono alcuni metodi / dimostrazioni meravigliosi disponibili per spiegare e comprendere una comprensione intuitiva - piuttosto che aritmetica - di questi concetti, ma sfortunatamente non sono ampiamente conosciuti (o insegnati a scuola, per quanto ne sappia).

Significare:

1. Punto di equilibrio: significa il fulcro

Il modo migliore per capire il concetto di significa pensarlo come il punto di equilibrio su un'asta uniforme. Immagina una serie di punti dati, come {1,1,1,3,3,6,7,10}. Se ciascuno di questi punti è segnato su un'asta uniforme e pesi uguali sono posizionati in ciascun punto (come mostrato di seguito), allora il fulcro deve essere posizionato alla media dei dati affinché l'asta si bilanci.

inserisci qui la descrizione dell'immagine

Questa dimostrazione visiva porta anche a un'interpretazione aritmetica. La logica aritmetica di ciò è che per bilanciare il fulcro, la deviazione negativa totale dalla media (sul lato sinistro del fulcro) deve essere uguale alla deviazione positiva totale dalla media (sul lato destro). Quindi, la media funge da punto di bilanciamento in una distribuzione.

Questo visual consente una comprensione immediata della media in relazione alla distribuzione dei punti dati. Un'altra proprietà della media che diventa immediatamente evidente da questa dimostrazione è il fatto che la media sarà sempre tra i valori minimo e massimo nella distribuzione. Inoltre, l'effetto dei valori anomali può essere facilmente compreso: la presenza di valori anomali potrebbe spostare il punto di bilanciamento e quindi influire sulla media.

2. Valore di ridistribuzione (equa quota)

Un altro modo interessante di comprendere la media è di pensarla come un valore di ridistribuzione . Questa interpretazione richiede una certa comprensione dell'aritmetica alla base del calcolo della media, ma utilizza una qualità antropomorfa - vale a dire il concetto socialista di ridistribuzione - per comprendere intuitivamente il concetto di media.

Il calcolo della media implica la somma di tutti i valori in una distribuzione (insieme di valori) e la divisione della somma per il numero di punti dati nella distribuzione.

X¯=(Σio=1nXio)/n

Un modo per comprendere la logica alla base di questo calcolo è quello di considerare ogni punto dati come mele (o qualche altro oggetto fungibile). Utilizzando lo stesso esempio di prima, abbiamo otto persone nel nostro campione: {1,1,1,3,3,6,7,10}. La prima persona ha una mela, la seconda persona ha una mela e così via. Ora, se si vuole ridistribuire il numero di mele in modo che sia "giusto" per tutti, è possibile utilizzare la media della distribuzione per farlo. In altre parole, puoi dare quattro mele (cioè il valore medio) a tutti affinché la distribuzione sia equa / uguale. Questa dimostrazione fornisce una spiegazione intuitiva per la formula sopra: dividere la somma di una distribuzione per il numero di punti dati equivale a partizionare l'intera distribuzione equamente a tutti i punti dati.

3. Visual Mnemonics

Questi seguenti mnemonici visivi forniscono l'interpretazione della media in un modo unico:

inserisci qui la descrizione dell'immagine

Questo è un mnemonico per l' interpretazione del valore di livellamento della media. L'altezza della traversa di A è la media delle altezze delle quattro lettere.

inserisci qui la descrizione dell'immagine

E questo è un altro mnemonico per l' interpretazione del punto di equilibrio della media. La posizione del fulcro è approssimativamente la media delle posizioni di M, E e N. raddoppiato

Mediano

Una volta compresa l'interpretazione della media come punto di bilanciamento su un'asta , la mediana può essere dimostrata da un'estensione della stessa idea: il punto di bilanciamento su una collana .

Sostituire l'asta con una stringa, ma mantenere i contrassegni e i pesi dei dati. Quindi alle estremità, attacca una seconda corda, più lunga della prima, per formare un anello [come una collana] e drappeggia il filo su una puleggia ben lubrificata.

inserisci qui la descrizione dell'immagine

Supponiamo, inizialmente, che i pesi siano distinti. La puleggia e l'anello si bilanciano quando lo stesso numero di pesi è su ciascun lato. In altre parole, il ciclo "si bilancia" quando la mediana è il punto più basso.

Si noti che se uno dei pesi viene spostato lungo il ciclo creando un valore anomalo, il ciclo non si sposta. Ciò dimostra, fisicamente, il principio che la mediana non è influenzata dai valori anomali.

Modalità

La modalità è probabilmente il concetto più semplice da comprendere in quanto comporta l'operazione matematica più elementare: il conteggio. Il fatto che sia uguale al punto dati che si verifica più frequentemente porta ad un acronimo: " M ost-spesso O ccurring D ata E lement".

La modalità può anche essere considerata il valore più tipico in un set. (Sebbene una comprensione più profonda di "tipico" porterebbe al valore rappresentativo o medio. Tuttavia, è opportuno equiparare "tipico" con la modalità basata sul significato molto letterale della parola "tipico".)


fonti:

  • The Median è un punto di equilibrio - Lynch, The College Mathematics Journal (2009)
  • Rendere memorabile la statistica: nuove mnemoniche e motivazioni - Lesser, Statistical Education, JSM (2011)
  • On the Use of Mnemonics for Teaching Statistics - Lesser, Model Assisted Statistics and Applications, 6 (2), 151-160 (2011)
  • Che cosa significa? - Watier, Lamontagne e Chartier, Journal of Statistics Education, Volume 19, Number 2 (2011)
  • Tipico? Idee per bambini e insegnanti sulla media - Russell and Mokros, ICOTS 3 (1990) RIFERIMENTO GENERALE: http://www.amstat.org/publications/jse/v22n3/lesser.pdf

Ho appena trovato questo articolo oggi che fa luce su questo: priceonomics.com/how-the-average-triumphed-over-the-median
Vishal

1
Un utente anonimo ha suggerito anche il seguente riferimento generale: amstat.org/publications/jse/v22n3/lesser.pdf
gung -

3

Mi chiedo se i tuoi criteri siano raggiungibili in quanto sembri desiderare la massima efficacia e il potere esplicativo con materiali minimi. Ma un semplice esempio come

1 1 2 2 2 3 3 4 5 6 15

consente il calcolo immediato della modalità (2), della mediana (3) e della media (44/11) = 4 e mostra quindi che possono essere diverse.

Potresti quindi spiegare che le idee del valore più comune, il valore nel mezzo e la media sono diverse. E introdurre complicazioni di

  1. la modifica dei valori per mostrare la modalità può essere ambigua

  2. usando un esempio con un numero pari di valori per spiegare la convenzione per il calcolo della mediana

  3. valori variabili nelle code per enfatizzare ciò che accade alla media e perché e perché no ciò potrebbe essere desiderabile.

  4. usando esempi più semplici in cui due o tre di modalità media, mediana e coincidono.

Non ho menzionato la tendenza centrale nel mio insegnamento se non per dire che è un termine in varie letterature. Preferisco parlare di livello e di come può essere quantificato. Al contrario, non credo che un'analisi dei dati seria sia possibile a meno che le persone non abbiano una minima sensazione di asimmetria come al solito più della simmetria.


Sì, la regolazione dei valori modificherà le statistiche di riepilogo, ma cosa significa ancora "significa" da solo?
Concerned_Citizen

1

1
Che cos'è il rosso ? Non abbiamo sempre bisogno di conoscere le definizioni per usare le idee. Una buona comprensione del rosso probabilmente richiede fisica, fisiologia e psicologia, ma non ne ho mai avuto bisogno. So molto su come funziona la media, ma a un livello fondamentale la sua definizione è solo la sua formula.
Nick Cox

1
@NickCox molto onesto e vero. ma la mia esperienza al college è ancora piuttosto recente e ricordo troppi problemi in cui ho calcolato ciecamente una risposta senza capire cosa ho calcolato o perché l'ho fatto
Shadowtalker

1
@ssdecontrol Questo non smette mai di accadere completamente ...
Nick Cox,

3

Ecco come li spiego:

La media (aritmetica) è il punto che tiene conto dell'intero set di dati e si stabilisce da qualche parte "nel mezzo". Invitali a pensare a una nuvola di punti, o a un blob, nello spazio: la media è il centro di massa di quella nuvola di punti.

La mediana è il punto che ha "lo stesso numero di punti su tutti i lati" (dove ovviamente il concetto di "lato" non è ben definito in 2+ dimensioni). Ciò rappresenta un altro tipo di "mezzo" e in effetti un tipo più intuitivo in un certo senso. Pensando allo stesso blob nello spazio, è chiaro che se il blob è sbilenco, la media verrà spostata. Ma questa sbilenco può essere raggiunta in due modi: o aggiungi più punti in un'area o aumenti la dispersione di punti in quell'area. Se aumenti la dispersione di punti in un'area senza aumentare il numero di punti, la mediana ha ancora lo stesso numero di punti "su tutti i lati" e non si sposterà in proporzione alla media.

y=(1,2,3,4,5)y'=(1,2,3,4,99)significare(y)=mediano(y)significare(y')>mediano(y'). Ma raccomando di iniziare prima con la spiegazione geometrica / visiva "basata su BLOB": nella mia esperienza è più facile iniziare con una dimostrazione grafica agitando la mano, quindi passare ad esempi concreti di giocattoli. Trovo che la maggior parte delle persone (me compreso) non siano naturalmente orientate ai numeri e iniziare con una spiegazione numerica è una ricetta per la confusione. Puoi sempre tornare indietro e insegnare definizioni più precise in seguito.

La modalità è il punto che, se i punti vengono campionati casualmente da quel BLOB, è più probabile che appaia (riconoscendo che si tratta di un fondente per i dati continui). Questo può essere, ma non deve essere, situato vicino alla media o alla mediana.

Una volta che hai spiegato questi concetti, allora si può spostare su un altro demo "statistico-looking":

dimostrazione

La linea continua è la media. La linea tratteggiata è la mediana. La linea tratteggiata è la modalità. La media rappresenta le posizioni dei punti dati lungo l'asse x, mentre la mediana riflette solo il numero di punti dati su entrambi i lati. La modalità è solo il punto di maggiore probabilità, che è diverso sia dalla media che dalla mediana.

Codice R:

set.seed(47730)
y <- rgamma(100, 2, 2)
d <- density(y)
plot(d)
rug(y)
abline(v = mean(y), lty = 1)
abline(v = median(y), lty = 2)
abline(v = d$x[which.max(d$y)], lty = 3)

Buone spiegazioni, ma in realtà ciò presuppone molto più delle "abilità aritmetiche di base": qui vengono invocati il ​​pensiero geometrico, la meccanica elementare, il campionamento casuale, la teoria della probabilità (compresa la funzione di densità). Questo è un commento, non inteso come una critica atroce, poiché penso che la domanda sia di ordine elevato.
Nick Cox

@NickCox buoni punti di sicuro. Ma ora che ci sto pensando, li sto usando, perché a loro volta possono essere spiegati tutti senza matematica (ad esempio la spiegazione "see-saw" di ttnphns nei commenti sulla domanda principale), oppure sono già capito intuitivamente a un certo livello da molte persone. La densità è un po 'raggiungibile, ma non credo che tu abbia mai bisogno di andarci
Shadowtalker

(@ttnphns: taggarti nel caso tu voglia pesare. Non mi lascerà taggare entrambi in un commento)
shadowtalker

La densità non è così astrusa. La maggior parte delle persone dovrebbe ricordare la densità della fisica e la densità della popolazione dalla geografia, o semplicemente le conoscenze generali.
Nick Cox,

@NickCox Pensavo fosse quello che intendevi con riferimento alla meccanica elementare. E a parte la demo della densità, non vedo nemmeno come sia necessario il campionamento casuale qui. Semmai, immaginavo che il punto critico sarebbe stato quello di mettere a proprio agio uno studente non tecnico con l'idea di una nuvola di punti. Forse prendi questo per chattare?
Shadowtalker

2

" Mean ", " median " e " mode " sono "tendenza centrale", ovvero "esito più probabile" in diversi settori. Sono tutte le "migliori scommesse" in diversi "giochi".

Probabilità e statistica è un campo che è stato, in parte, creato da giocatori d'azzardo ( link , link ). Quando vai alle corse di cavalli o al tavolo da poker, vuoi conoscere alcune scienze che ti aiutano a vincere. Lo hanno fatto anche loro e ne hanno scritto, quindi non devi inventarlo da solo.

In una corsa di cavalli, vuoi scegliere un vincitore. Non hai informazioni future, ma conosci alcune informazioni passate. Sai quanto velocemente ogni cavallo ha corso nelle ultime gare. Se vuoi fare una stima della velocità con cui correranno probabilmente nella loro prossima gara, puoi calcolare e confrontare la media, ovvero la media, dei tempi di gara.

Un'altra tendenza centrale è la "mediana", che è il centro di un elenco ordinato. E se inserissi un errore orribile nella tua lista dei tempi di gara e il valore fosse 1000 volte più lungo di tutti gli altri. Avrebbe incasinato la tua stima. Non puoi scommettere sul cavallo vincitore. Come lo affronti? È possibile cercare manualmente quell'unico valore oppure utilizzare la "mediana".

Che cosa succede se stai giocando a carte, come " blackjack ", e stai cercando di capire se hai bisogno di un'altra carta date le carte precedenti. La carta che stai cercando non è una 3.14 perché i numeri delle carte sono valori interi. Come capisci qual è la tua scommessa migliore quando "media" o mediana non è significativa? In questo caso, vuoi scommettere sulla "modalità" - la carta più probabile che esce dalla pila dei mazzieri.

In tutti e tre i casi, la tendenza centrale è solo un altro modo di dire "scommessa migliore".

Se si desidera tenere conto non solo della tendenza centrale delle scommesse, vale a dire se si desidera scommettere in modo da poter ridurre gli impatti di una perdita massimizzando le vincite, è necessario considerare le "tendenze della variazione". Cose come la deviazione standard, gli intervalli inter-quantili o le modalità alternative e le loro frequenze, sono tutte usate per minimizzare le perdite massime massimizzando al contempo le probabili vincite.


0

Penso che sia utile spiegare questo concetto quando si considerano molteplici mezzi, mediane e modalità. Questi valori non esistono da soli nel vuoto.

Ad esempio, ecco come spiegherei cattivo.

Supponiamo che tu abbia 2 casse di angurie (cassa 1 e 2). È sigillato in modo da non poter vedere le angurie all'interno e quindi non conosci le loro dimensioni. Tuttavia, conosci i pesi totali delle angurie in ciascuna cassa e ognuna contiene lo stesso numero di angurie. Da ciò, è possibile calcolare i pesi medi di ciascuna cassa di angurie (M1 e M2).

Ora che hai due diversi valori medi M1 e M2, puoi fare un confronto approssimativo dei singoli contenuti. Se M1> M2, allora un'anguria selezionata casualmente dalla cassa 1 potrebbe probabilmente essere più pesante di una presa dalla cassa 2.

Certo, mi piacerebbe commenti su questa prospettiva.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.