Controesempi in cui la mediana è al di fuori di [Mode-Mean]


11

Questo articolo è al di sopra della mia lega, ma parla di un argomento che mi interessa, la relazione tra media, modalità e mediana. Dice :

È opinione diffusa che la mediana di una distribuzione unimodale sia "di solito" tra la media e la modalità. Tuttavia, questo non è sempre vero...

La mia domanda : qualcuno può fornire esempi di distribuzioni unimodali continue (idealmente semplici) in cui la mediana è al di fuori dell'intervallo [mode, mean]? Ad esempio una distribuzione come mode < mean < median.

=== MODIFICA =======

Ci sono già buone risposte di Glen_b e Francis, ma mi sono reso conto che quello che mi interessa veramente è un esempio in cui mode <mean <mediano o mediano <mean <mode (ovvero sia la mediana è al di fuori di [mode, mean] E la mediana è "dalla stessa parte" come media della modalità (cioè sia sopra che sotto). Posso accettare le risposte qui sono aperte una nuova domanda o forse qualcuno può suggerire una soluzione qui direttamente?


Non è un problema estendere la risposta per coprire il caso più limitato.
Glen_b

2
Dai un'occhiata alla figura 6 qui: ww2.amstat.org/publications/jse/v13n2/vonhippel.html che fornisce un esempio Weibull (unimodale continuo) in cui la mediana non è tra la modalità e la media.
Matthew Towers,

Risposte:


14

Certo, non è difficile trovare esempi - anche continui unimodali - in cui la mediana non è tra la media e la modalità.

  1. Considera iid da una distribuzione triangolare della formaf T ( t ) = 2 ( 1 - t ) 1 0 < t < 1T1,T2fT(t)=2(1t)10<t<1

    Ora lascia che sia una miscela 60-40 di e .T 1 - 4 T 2XT14T2

    La densità di è simile a questa:X

    Miscela di due densità triangolari con la mediana al di fuori dell'intervallo modalità-media

    La media è inferiore a 0, la modalità è a 0, ma la mediana è superiore a 0. Una modifica minore di ciò fornirebbe un esempio in cui anche la densità (piuttosto che solo il cdf) era continua, ma la relazione tra posizione-misure era lo stesso (modifica: vedi 3. sotto).

  2. Generalizzando, mettiamo una proporzione (con ) della probabilità totale nel triangolo del lato destro e una proporzione nel triangolo del lato sinistro (al posto di 0,6 e 0,4 abbiamo avuto prima). Inoltre, crea il fattore di ridimensionamento nella metà sinistra anziché (con ):0 < p < 1 ( 1 - p ) - β - 4 β > 0p0<p<1(1p)β4β>0

    densità per la versione generalizzata di quella miscela di due densità triangolari

    Ora supponendo , la mediana sarà sempre nell'intervallo coperto dal triangolo rettangolo, quindi la mediana supererà la modalità (che rimarrà sempre a ). In particolare, quando , la mediana sarà a .p>120p>1211/2p

    La media sarà a .(pβ(1p))/3

    Se la media sarà al di sotto della modalità e se la media sarà al di sopra della modalità.β>p/(1p)β<p/(1p)

    D'altra parte, vogliamo per mantenere la media sotto la mediana.(pβ(1p))/3<11/2p

    Considera ; questo pone la mediana sopra la modalità.p=0.7

    Quindi soddisferebbe quindi la media è sopra la modalità.β=2β<p/(1p)

    La mediana è in realtà a mentre la media è a . Quindi per e , abbiamo mode <mean <median.11/1.40.15480.72(0.3)30.0333p=0.7β=2

    (NB Per coerenza con la mia notazione, la variabile sull'asse x per entrambi i grafici dovrebbe essere anziché ma non ho intenzione di tornare indietro e risolverlo.)xt

  3. Questo è un esempio in cui la densità stessa è continua. Si basa sull'approccio in 1. e 2. sopra, ma con il "salto" sostituito con una pendenza ripida (e quindi l'intera densità è ruotata di circa 0 perché voglio un esempio che sembra inclinato a destra).

    densità lineare continua a tratti con modalità <media <media

    [Utilizzando l'approccio "miscela di densità triangolari", può essere generato come una miscela di 3 variate in scala indipendenti della forma triangolare descritta nella sezione 1. Ora abbiamo il 15% , il 60% e il 25% .]T13T25T3

    Come vediamo nel diagramma sopra, la media è nel mezzo, come richiesto.


  1. Nota che m_t_ menziona Weibull nei commenti (per i quali la mediana è al di fuori dell'intervallo per un piccolo intervallo del parametro di forma ). Ciò è potenzialmente soddisfacente perché è una distribuzione continua (e regolare) unimodale ben nota con una forma funzionale semplice.[mode,mean]k

    In particolare, per i piccoli valori del parametro di forma di Weibull, la distribuzione è inclinata a destra e abbiamo la solita situazione mediana tra la modalità e la media, mentre per i grandi valori del parametro di forma di Weibull, la distribuzione è inclinata a sinistra , e abbiamo di nuovo quella situazione "mediana nel mezzo" (ma ora con la modalità a destra anziché la media). Tra questi casi c'è una piccola regione in cui la mediana è al di fuori dell'intervallo della modalità media e nel mezzo la media e la modalità si incrociano:

          k                 order
     (0,3.2589)      mode < median < mean
      ≈ 3.2589       mode = median < mean
    (3.2589,3.3125)  median < mode < mean    (1)
      ≈ 3.3215       median < mode = mean
    (3.3215,3.4395)  median < mean < mode    (2)
      ≈ 3.4395       median = mean < mode
      3.4395+        mean < median < mode
      (≈3.60235      moment-skewness = 0)
    

    Scegliendo valori convenienti per il parametro shape negli intervalli contrassegnati (1) e (2) sopra - quelli in cui gli spazi tra le statistiche sulla posizione sono quasi uguali - otteniamo:

    Densità di Weibull con mediana al di fuori dell'intervallo modalità-media

    Sebbene questi soddisfino i requisiti, purtroppo i tre parametri di posizione sono così vicini che non possiamo distinguerli visivamente (rientrano tutti nello stesso pixel), il che è un po 'deludente - i casi dei miei precedenti esempi sono molto più separato. (Tuttavia suggerisce situazioni da esaminare con altre distribuzioni, alcune delle quali potrebbero dare risultati più visivamente distinti.)


Funziona, grazie. Per curiosità, quale sarebbe una simile "distribuzione triangolare" dove mode <significa <mediana? (qui mediana <modalità <media)
Janthelme il

In realtà nel mio esempio originale significa <mode <mediana; hai avuto le disuguaglianze all'indietro lì. Ho ora aggiunto un esempio simile in cui la media è sopra la modalità ma sotto la mediana (in effetti, avresti semplicemente potuto sostituire l'originale con dire e mantenere le proporzioni della miscela a per la parte destra e per la parte sinistra). 4T21.25T20.60.4
Glen_b

6

Il seguente esempio è tratto dai Counterexample in Probability di Jordan Stoyanov .

Data la costante positiva e , considera una variabile casuale con densità La media , la mediana modalità di possono essere trovate come Nota è una densità solo se Quindi se lasciamo allora . Di conseguenza, se scegliamo un che è vicino acλX

f(x)={ceλ(xc),x(c,)x,x(0,c]0,x(,0].
μmMXf ( x ) c 2
μ=c33+c2λ+cλ2,m=1,M=c.
f(x)c1λ2c>111.0001μ>cM=cmμM
c22+cλ=1.
c1λ2c>11 (ad esempio ), possiamo trovare che e , quindi mediana non rientra tra i e .1.0001μ>cM=cmμM

0

Prendi la distribuzione esponenziale con il parametro rate a e la densità a exp (-ax) per 0 <= x <infinito. La modalità è a zero. Naturalmente la media e la mediana sono maggiori di 0. Il cdf è 1-exp (-ax). Quindi per la mediana risolvere per exp (-ax) = 0,5 per x. Quindi -ax = ln (0,5) o x = -ln (0,5) / a. Per la media integrare ax exp (-ax) da 0 a infinito. Prendi a = 1 e abbiamo una mediana = -ln (0,5) = ln (2) e media = 1.

Quindi mode <mediana <significa.


1
Siamo spiacenti, ma non stiamo cercando distribuzioni in cui mode <significa <mediana (o più in generale dove la mediana è al di fuori di [modalità, media])?
Janthelme,

3
Scusate la confusione, ho aggiunto alla domanda originale, ma quello che stavo chiedendo originariamente è per esempi in cui la mediana è al di fuori di [mode, mean] mentre penso che la median sia all'interno di [mode, median] nel vostro esempio.
Janthelme,

3
Michael, la domanda non chiede un caso in cui la mediana è tra la modalità e la media. Hai citato l'originale nel tuo commento appena sopra questo; la domanda non dice "mode <median <mean" dove si afferma che lo fa (e non lo ha mai fatto in nessun punto della cronologia delle modifiche). Di conseguenza, la risposta fornisce un caso che non è richiesto; in effetti questa è la solita situazione (mediana nel mezzo delle altre due) da cui la domanda cerca eccezioni. Quasi ogni distribuzione unimodale distorta ben nota ha la mediana nel mezzo: il trucco sta nel trovare quelli che non lo fanno.
Glen_b -Restate Monica

1
La cronologia delle modifiche è disponibile facendo clic sul collegamento rosso nella parte inferiore della domanda, dove attualmente dice "modificato 18 ore fa" (è cambiato in 19 mentre stavo scrivendo questi commenti). Puoi vedere la cronologia delle modifiche facendo clic lì. La domanda è stata pubblicata 22 ore fa (mentre scrivo ora) e quando fai clic sulla cronologia delle modifiche, la domanda originale può essere visualizzata nella parte inferiore con l'etichetta "1". La tua risposta è apparsa circa 2 ore dopo (20 ore fa), quando era quello che la domanda diceva ancora. Circa 1-2 ore dopo il tuo post, l'OP ha modificato una volta la loro domanda, che può essere vista ...
Glen_b -Reinstate Monica

1
ctd ... nella parte superiore della cronologia delle modifiche. C'è una finestra di due minuti dopo ogni modifica per apportare le modifiche che contano come parte di quella modifica (ovvero 22 ore fa e 18-19 ore fa c'era un due- finestra dei minuti ogni volta che si dice che un errore di battitura potrebbe essere stato corretto) ma ~ 20 ore fa quando hai pubblicato, la domanda era rimasta invariata per circa 2 ore ed è rimasta invariata per più di un'ora dopo la tua pubblicazione, quando una modifica importante ( mostrato nella cronologia delle modifiche) è stato eseguito. Qualsiasi modifica al di fuori di quelle brevi finestre di post-modifica di due minuti sarebbe nella cronologia delle modifiche.
Glen_b -Restate Monica
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.