Perché tutte le distribuzioni conosciute sono unimodali?


13

Non conosco distribuzioni multimodali.

Perché tutte le distribuzioni conosciute sono unimodali? Esiste una distribuzione "famosa" che ha più di una modalità?

Certo, le miscele di distribuzioni sono spesso multimodali, ma vorrei sapere se esistono distribuzioni "non miscele" che hanno più di una modalità.


5
Stai parlando di distribuzioni "standard" piuttosto che di distribuzioni "note".
Stéphane Laurent,

12
Che ne dici di beta con α=β=0.5 ?
ameba dice Ripristina Monica il

1
Se non ti dispiace distribuzioni bimodali limitate , Wikipedia menziona anche la distribuzione U-quadratica e quella arcosina . Penso che questi siano solo casi speciali della distribuzione beta ... Wikipedia menziona anche alcuni esempi di eventi naturali di distribuzioni multimodali .
Nick Stauner,

12
@ StéphaneLaurent: Mi piacciono le "distribuzioni di marchi" , perché trasmettere che essere stato nominato non implica di per sé uno status speciale per una distribuzione. Le distribuzioni "conosciute" fanno sembrare che il resto possa essere là fuori da qualche parte in attesa di essere scoperto, come il mostro di Loch-Ness o la materia oscura.
Scortchi - Ripristina Monica

5
Eccellente @Scortchi, ottimo vocabolario! Molti scienziati non matematici che ho incontrato hanno l'impressione che non esista una distribuzione senza nome. Forse c'è un fatto filosofico più profondo dietro a ciò, la confusione di un nome e della cosa indicata con questo nome (come diceva Russell, "La parola 'cane' non assomiglia a un cane")
Stéphane Laurent

Risposte:


17

La prima parte della questione venga risolta in commenti alla domanda: un sacco di "marca" distribuzioni sono multimodale, come ogni Beta (a,b) distribuzione con a<1 e b<1 . Passiamo, quindi, alla seconda parte della domanda.

Tutte le distribuzioni discrete sono chiaramente miscele (di atomi, che sono unimodali).

Mostrerò che le distribuzioni più continue sono anche miscele di distribuzioni unimodali. L'intuizione alla base di questo è semplice: possiamo "levigare" i dossi da un grafico irregolare di un PDF, uno per uno, fino a quando il grafico è orizzontale. I dossi diventano i componenti della miscela, ognuno dei quali è ovviamente unimodale.

Di conseguenza, tranne forse per alcune distribuzioni insolite i cui PDF sono altamente discontinui, la risposta alla domanda è "nessuna": tutte le distribuzioni multimodali che sono assolutamente continue, discrete o una combinazione di queste due sono miscele di distribuzioni unimodali.


Considera le distribuzioni continue F cui PDF f sono continui (queste sono le distribuzioni "assolutamente continue"). (La continuità non è molto una limitazione; può essere ulteriormente rilassata da un'analisi più attenta, supponendo semplicemente che i punti di discontinuità siano discreti.)

Per far fronte a "plateau" di valori costanti che potrebbero verificarsi, definire una "modalità" in modo che sia un intervallo m=[xl,xu] (che potrebbe essere un singolo punto in cui xl=xu ) tale che

  1. ha un valore costante su m , diciamo y .fm,y

  2. non è costante su alcun intervallo che contiene rigorosamente m .fm

  3. Esiste un numero positivo tale che il valore massimo di f raggiunto su [ x l - ϵ , x u + ϵ ] è uguale a y .ϵf[xlϵ,xu+ϵ]y

Sia qualsiasi modo di f . Poiché f è continuo, vi sono intervalli [ x l , x u ] contenenti m per i quali f non diminuisce in [ x l , x l ] (che è un intervallo corretto, non solo un punto) e non aumenta in [ x u , x u ]m=[xl,xu]ff[xl,xu]mf[xl,xl][xu,xu] (che è anche un intervallo corretto). Lascia xl be the infinimum of all such values and xu the supremum of all such values.

This construction has defined one "hump" on the graph of f extending from xl to xu. Let y be the larger of f(xl) and f(xu). By construction, the set of points x in [xl,xu] for which f(x)y is a proper interval m strictly containing m (because it contains either the whole of [xl,xl] or [xu,xu]).

Figure

In this illustration of a multimodal PDF, a mode m=[0,0] is identified by a red dot on the horizontal axis. The horizontal extent of the red portion of the fill is the interval m: it is the base of the hump determined by the mode m. The base of that hump is at height y0.16. The original PDF is the sum of the red fill and the blue fill. Notice that the blue fill only has one mode near 2; the original mode at [0,0] has been removed.

Writing |m| for the length of m, define

pm=PrF(m)y|m|

and

fm(x)=f(x)ypm

when xm and fm(x)=0 otherwise. (This makes fm a continuous function, incidentally.) The numerator is the amount by which f rises above y and the denominator pm is the area between the graph of f and y. Thus fm is non-negative and has total area 1: it is the PDF of a probability distribution. By construction it has a unique mode m.

Also by construction, the function

fm(x)=f(x)pmfm(x)1pm

is a PDF provided pm<1. (Obviously if pm=1 there is nothing left of f, which must have been unimodal to begin with.) Moreover, it has no modes in the interval m (where it is constant, which is why the previous careful definition of a mode as an interval was necessary). Furthermore,

f(x)=pmfm(x)+(1pm)fm(x)

is a mixture of the unimodal PDF fm and the PDF fm.

Iterate this procedure with fm (which as a linear combination of continuous functions is still a continuous function, enabling us to proceed as before), producing a sequence of modes m=m1,m2,; corresponding sequences of weights p1=pm,p2=pm2,; and PDFs f1=fm,f2=fm2,. The limiting result exists because (a) the interval where fi is flattened includes a proper interval that had not been flattened in the preceding i1 operations and (b) the real numbers cannot be decomposed into more than a countable number of such intervals. The limit cannot have any modes and therefore is constant, which must be zero (for otherwise its integral would diverge). Consequently, f has been expressed (perhaps not uniquely, because the order in which modes were selected will matter) as a mixture

f(x)=ipifi(x)

of unimodal distributions, QED.


7

By unimodal, I think the OP plainly means that there is just one interior mode (i.e. excluding corner solutions). The question is thus really asking ...

why is it that brand name distributions do NOT have more than one interior mode?

i.e. why do most brand name distributions look something like this:

enter image description here

... plus or minus some skewness or some discontinuities? When the question is posed thus, the Beta distribution would not be a valid counter example.

It appears the OP's conjecture has some validity: most common brand name distributions do not allow for more than one interior mode. There may be theoretical reasons for this. For example, any distribution that is a member of the Pearson family (which includes the Beta) will necessarily be (interior) unimodal, as a consequence of the parent differential eqn that defines the entire family. And the Pearson family nests most of the best-known brand names.

Nevertheless, here are some brand name counter examples ...

Counter example

One brand-name counter-example is the Sinc2 distribution with pdf:

f(x)=sin2(x)πx2

defined on the real line. Here is a plot of the Sinc2 pdf:

enter image description here

We could also perhaps add the family of cardiod and distributions related to this class ... with pdf plots such as:

enter image description here

The family of reflected brand name distributions would also perhaps be possible brand name contenders (though, these might be thought of as a 'cheat solution' ... but they are still brand names) such as the Reflected Weibull shown here:

enter image description here


1
My, that plot of Sinc2 sure looks like it has some negative values! (Could that be a plotting artifact?) ... And the cardioid distributions look like they have only one interior mode each.
whuber

1
Hi @whuber ... must agree re the plotting artefact (I will take that up on Mathematica SE !). Re cardiod family: idea is that one can extend the domain of such families as one please, and like a sine wave, it keeps on giving :)
wolfies

1
(+1) It is a strange artifact: your last plot (of reflected distributions) does not seem to exhibit it. You might trace the generation of plot points in the Sinc2 plot to see where they lie; I suspect the slight negative values might be an overshooting of a spline of a small number of points.
whuber

I think it is just because the plotted line is thicker than the axis line, so appears to 'overshoot' the axis when close to zero. If the line is plotted thinner, the artefact disappears.
wolfies

But there is no such artifact in your bottom figure, which also has lines thicker than the axis.
whuber

3

That you mightn't think of any doesn't mean there aren't any.

I can name "known" distributions that aren't unimodal.

For example, a Beta distribution with α and β both <1.

http://en.wikipedia.org/wiki/Beta_distribution

also see

http://en.wikipedia.org/wiki/U-quadratic_distribution

(This isn't a special case of the beta distribution, in spite of the comment that says it is. The two families have some overlap, however.)

Mixture distributions are certainly known, and many of those are multimodal.


The U-quadratic is a truncated Beta distribution.
becko

1

La distribuzione Alpha-skew-normal (Elal-Olivero 2010) ha un PDF:

(1αxμσ)2+12+α2φ(xμσ),

where φ is the PDF of a standard Gaussian.

For |α|>1.34 the distribution is bimodal. Examplary plot for μ=1,σ=0.5,a=2:

enter image description here

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.