Senza dubbio ti è stato detto diversamente, ma mean median non implica simmetria.=
C'è una misura dell'asimmetria basata sulla media meno la mediana (la seconda asimmetria di Pearson), ma può essere 0 quando la distribuzione non è simmetrica (come una qualsiasi delle comuni misure di asimmetria).
Allo stesso modo, la relazione tra media e mediana non implica necessariamente una relazione simile tra il midhinge ( ) e la mediana. Possono suggerire l'asimmetria opposta, oppure uno può eguagliare la mediana mentre l'altro no.(Q1+Q3)/2
Un modo per indagare sulla simmetria è tramite un diagramma di simmetria *.
Se sono le osservazioni ordinate dal più piccolo al più grande (le statistiche dell'ordine), e M è la mediana, quindi un diagramma di simmetria traccia Y ( n ) - M vs M - Y ( 1 ) , Y ( n - 1 ) - M vs M - Y ( 2 )Y(1),Y(2),...,Y(n)MY(n)−MM−Y(1)Y(n−1)−MM- Y( 2 ) , ... e così via.
* Minitab può farlo . In effetti, ho sollevato questa trama come una possibilità perché le ho viste fatte in Minitab.
Ecco quattro esempi:
Diagrammi di simmetria
(Le distribuzioni effettive erano (da sinistra a destra, prima la riga superiore) - Laplace, Gamma (forma = 0,8), beta (2,2) e beta (5,2). Il codice è di Ross Ihaka, da qui )
Con esempi simmetrici dalla coda pesante, spesso accade che i punti più estremi possano essere molto lontani dalla linea; presteresti meno attenzione alla distanza dalla linea di uno o due punti mentre ti avvicini alla parte in alto a destra della figura.
Ci sono ovviamente altri grafici (ho menzionato il diagramma di simmetria non da un particolare senso di difesa di quel particolare, ma perché sapevo che era già stato implementato in Minitab). Quindi esploriamo alcuni altri.
Ecco i corrispondenti disallineamenti che Nick Cox ha suggerito nei commenti:
Trame di asimmetria
In questi grafici, una tendenza in alto indicherebbe una coda destra in genere più pesante di quella sinistra e una tendenza in basso indicherebbe una coda sinistra in genere più pesante di destra, mentre la simmetria sarebbe suggerita da una trama relativamente piatta (sebbene forse abbastanza rumorosa).
Nick suggerisce che questa trama è migliore (in particolare "più diretta"). Sono propenso ad essere d'accordo; l'interpretazione della trama sembra di conseguenza un po 'più semplice, sebbene le informazioni nei grafici corrispondenti siano spesso abbastanza simili (dopo aver sottratto la pendenza unitaria nel primo set, si ottiene qualcosa di molto simile al secondo set).
[Naturalmente, nessuna di queste cose ci dirà che la distribuzione da cui sono stati estratti i dati è in realtà simmetrica; otteniamo un'indicazione di quanto sia quasi simmetrico il campione, e quindi in tale misura possiamo giudicare se i dati sono ragionevolmente coerenti con l'essere ricavati da una popolazione quasi simmetrica.]