Qualcuno può offrire un esempio di una distribuzione unimodale che ha un'inclinazione pari a zero ma che non è simmetrica?


31

Nel maggio 2010 l'utente Mcorazao di Wikipedia ha aggiunto una frase all'articolo di asimmetria secondo cui "Un valore zero indica che i valori sono distribuiti in modo relativamente uniforme su entrambi i lati della media, in genere ma non necessariamente implicando una distribuzione simmetrica". Tuttavia, la pagina wiki non contiene esempi concreti di distribuzioni che infrangono questa regola. Anche googling "esempi di distribuzioni asimmetriche con zero asimmetria" non fornisce esempi reali, almeno nei primi 20 risultati.

Usando la definizione che l'inclinazione viene calcolata da e la R formulaE[(Xμσ)3]

sum((x-mean(x))^3)/(length(x) * sd(x)^3)

Posso costruire una distribuzione piccola e arbitraria per ridurre l'asimmetria. Ad esempio, la distribuzione

x = c(1, 3.122, 5, 4, 1.1) 

produce un disallineamento di . Ma questo è un piccolo campione e inoltre la deviazione dalla simmetria non è grande. Quindi, è possibile costruire una distribuzione più ampia con un picco che è altamente asimmetrico ma che ha ancora un'asimmetria quasi zero?5.64947105


3
Vuoi che la distribuzione sia unimodale o no? Lo dice il titolo, ma il testo menziona a malapena questo punto.
Dilip Sarwate,

@Dilip Sì, lo troverei più interessante se la distribuzione fosse unimodale, dal momento che l'asimmetria, come momento centrale, non ha davvero senso altrimenti.
Andy McKenzie,

Risposte:


28

Prendi in considerazione distribuzioni discrete. Uno che è supportato su valori è determinato da probabilità non negative fatte salve le condizioni che (a) sommano a 1 e (b) il coefficiente di asimmetria è uguale 0 (che equivale a zero del terzo momento centrale). Ciò lascia gradi di libertà (nel senso di risoluzione dell'equazione, non quello statistico!). Possiamo sperare di trovare soluzioni che non sono modali.x 1 , x 2 , , x k p 1 , p 2 , , p k k - 2kx1,x2,,xkp1,p2,,pkk2

Per facilitare la ricerca di esempi, ho cercato soluzioni supportate su un piccolo vettore simmetrico con una modalità univoca a , media zero e zero asimmetria. Una di queste soluzioni è .0 ( p 1 , ... , p 7 ) = ( 1396 , 3286 , 9586 , 47386 , 8781 , 3930 , 1235 ) / 75600x=(3,2,1,0,1,2,3)0(p1,,p7)=(1396,3286,9586,47386,8781,3930,1235)/75600

Funzione di probabilità

Puoi vedere che è asimmetrico.

Ecco una soluzione più ovviamente asimmetrica con (che è asimmetrico) e :p = ( 1 , 18 , 72 , 13 , 4 ) / 108x=(3,1,0,1,2)p=(1,18,72,13,4)/108

Funzione di probabilità 2

Ora è ovvio cosa sta succedendo: poiché la media è uguale a , i valori negativi contribuiscono e al terzo momento mentre i valori positivi contribuiscono e , bilanciando esattamente i contributi negativi. Possiamo prendere una distribuzione simmetrica di circa , come con e spostare una piccola massa da a , una piccola massa da a e una leggera quantità di massa a( - 3 ) 3 = - 27 18 × ( - 1 ) 3 = - 18 4 × 2 3 = 32 13 × 1 3 = 13 0 x = ( - 1 , 0 , 1 ) p = ( 1 , 4 , 1 ) / 6 + 1 + 2 + 1 - 10(3)3=2718×(1)3=184×23=3213×13=130x=(1,0,1)p=(1,4,1)/6+1+2+110 03, mantenendo la media su e anche l' asimmetria su , mentre si crea un'asimmetria. Lo stesso approccio funzionerà per mantenere zero media e zero asimmetria di una distribuzione continua rendendola asimmetrica; se non siamo troppo aggressivi con lo spostamento di massa, rimarrà immodale.00


Modifica: distribuzioni continue

Poiché il problema continua a presentarsi, diamo un esempio esplicito con distribuzioni continue. Peter Flom ha avuto una buona idea: guarda le miscele di normali. Una miscela di due normali non farà: quando svanisce la sua asimmetria, sarà simmetrica. Il prossimo caso più semplice è una miscela di tre normali.

Le miscele di tre normali, dopo un'opportuna scelta di posizione e scala, dipendono da sei parametri reali e quindi dovrebbero avere una flessibilità più che sufficiente per produrre una soluzione asimmetrica e senza inclinazioni. Per trovarne alcuni, dobbiamo sapere come calcolare le asimmetrie di miscele di normali. Tra questi, cercheremo quelli che sono unimodali (è possibile che non ce ne siano).

Ora, in generale, il momento (non centrale) di una distribuzione normale standard è zero quando è dispari e altrimenti è uguale a . Quando ridimensioniamo quella distribuzione normale standard per avere una deviazione standard di , il momento viene moltiplicato per . Quando spostiamo qualsiasi distribuzione di , il nuovo momento può essere espresso in termini di momenti fino a inclusorthr2r/2Γ(1r2)/πσrthσrμrthr. Il momento di una miscela di distribuzioni (cioè una media ponderata di esse) è la stessa media ponderata dei singoli momenti. Infine, l'asimmetria è zero esattamente quando il terzo momento centrale è zero, e questo viene prontamente calcolato in termini dei primi tre momenti.

Questo ci dà un attacco algebrico al problema. Una soluzione che ho trovato è una miscela uguale di tre normali con parametri uguali a , e . La sua media è uguale . Questa immagine mostra il pdf in blu e il pdf della distribuzione capovolto sulla sua media in rosso. Il fatto che differiscano dimostra che sono entrambi asimmetrici. (La modalità è approssimativamente di , dalla media di .) Entrambi hanno zero asimmetria per costruzione .(μ,σ)(0,1)(1/2,1)(0,127/18)(0,2.65623)(0+1/2+0)/3=1/60.05192161/6

Esempi continui

I grafici indicano che questi sono unimodali. (Puoi controllare usando Calculus per trovare i massimi locali.)


(+1) Risposta molto brillante. Funzionerà comunque con distribuzioni continue? Il cambio non potrebbe potenzialmente creare minuscole modalità? Potrei non pensare direttamente ...
Macro

1
Stai pensando abbastanza bene, Macro: dovremmo essere tutti così scettici. Il trucco è spostare piccole quantità distribuite su ampie gamme. Un test di derivata iniziale ti consentirà di verificare le possibili modalità e fornirà anche la base per una prova che turni sufficientemente piccoli di questo modulo non produrranno nuove modalità.
whuber

Grazie per la risposta! Questo è simile a quello che stavo pensando intuitivamente, anche se non riuscivo a dirlo in parole bene - che devi "bilanciare" la massa su ciascun lato della distribuzione. Mi chiedo se ci sono modi stereotipati in cui si può eseguire questo atto di bilanciamento.
Andy McKenzie,

Un modo, Andy, è quello di iniziare con una soluzione discreta e quindi di contrapporla con una distribuzione normale. In questo caso, il requisito di unimodalità costringerà quella distribuzione normale ad avere una grande deviazione standard. Tuttavia, se la convoluzione non modifica in modo apprezzabile le proprietà richieste (come l'asimmetria zero), o lo cambia in modo prevedibile, hai una gestione matematica del problema. In un certo senso la mia recente modifica può essere vista come un simile attacco, sebbene non sia strettamente una convoluzione (perché le tre normali hanno deviazioni standard diverse).
whuber

2
Ho controllato, Andy: coinvolgere la soluzione discreta con una distribuzione normale non cambia l'asimmetria. Quando si assegna a tale distribuzione normale una deviazione standard di circa 0,57 o superiore, il risultato non è modale. Come la distribuzione discreta sottostante, continua ad avere zero media, zero asimmetria ed essere asimmetrica. Mischiarlo con una distribuzione normale standard equivale a un movimento controllato di massa tra la distribuzione normale normale e discreta: ciò potrebbe soddisfare la tua richiesta di un metodo "stereotipato".
whuber

23

Eccone uno che ho trovato su https://www.qualitydigest.com/inside/quality-insider-article/problems-skewness-and-kurtosis-part-one.html# che trovo carino e riprodotto in R: un Burr inverso o distribuzione Dagum con parametri di forma e :k=0.0629c=18.1484

g(x)=ckx(c+1)[1+xc](k+1)

Ha media 0,5387, deviazione standard 0,2907, asimmetria 0,0000 e curtosi 2,0000. La fonte la chiama anche "distribuzione di elefanti": inserisci qui la descrizione dell'immagine

La mia riproduzione in R è stata creata con

library(actuar)
library(knotR)

# a nonsymmetric distribution with zero skewness
# see https://www.qualitydigest.com/inside/quality-insider-article/problems-skewness-and-kurtosis-part-one.html#

c <- 18.1484
k <- 0.0629

x <- seq(0,1.5,by=.0001)

elephant.density <- dinvburr(x, k, c)
plot(x,elephant.density, type="l")
polygon(c(min(x),x),c(min(elephant.density),elephant.density), col="grey")
points(0.8,0.8, pch=19, cex=2)

# "ears" created via https://www.desmos.com/calculator/cahqdxeshd
ear.x <- c(0.686, 0.501, 0.42, 0.68)
ear.y <- c(0.698, 0.315, 1.095, 0.983)

myseg(bezier(cbind(ear.x, ear.y)), type="l")

EX <- gamma(k+1/c)*gamma(1-1/c)/gamma(k) # see p6 of https://wwz.unibas.ch/uploads/tx_x4epublication/23_07.pdf
EX2 <- gamma(k+2/c)*gamma(1-2/c)/gamma(k)
EX3 <- gamma(k+3/c)*gamma(1-3/c)/gamma(k)
(skewness <- (EX3 - 3*EX*(EX2-EX^2)-EX^3)/(EX2-EX^2)^(3/2)) # zero to three digits: 0.0003756196

Come mostra questo output, l'asimmetria non è del tutto da zero a quattro cifre per questi valori di parametro. Ecco un piccolo ottimizzatore per e :kc

   # optimize skewness a bit further
    skewval <- 1

while (skewval > 10^(-10)){
  optskew.k <- uniroot(skewness.fun, lower = k*.95, upper = k*1.1, tol=skewval^2, c=c)
  skewval <- optskew.k$f.root
  k <- optskew.k$root

  optskew.c <- uniroot(skewness.fun, lower = c*.95, upper = c*1.1, tol=skewval^2, k=k)
  skewval <- optskew.c$f.root
  c <- optskew.c$root
}

cedevole

> print(c)
[1] 18.89306

> print(k)
[1] 0.05975542

> print(skewval)
[1] -1.131464e-15

Grazie per la modifica. Detto questo, non sono riuscito a riprodurre l'asimmetria da 0,0000 a quattro cifre, ottenendo invece 0,0001245138 (vedi modifica successiva, nel codice R).
Christoph Hanck,

Probabilmente si può eseguire un semplice ottimizzatore per trovare i valori e tale che l'asimmetria sia il più vicino possibile allo zero. Dovrebbe essere un paio di righe aggiuntive o forse anche una. Hai già la funzione di perdita calcolata analiticamente nell'ultima riga, esiste un ottimizzatore generico adatto in R? ck
ameba dice Reinstate Monica il

In realtà, 0.0003756196. 0,0001245138 era già dopo qualche ottimizzazione iniziale, fornita qui per errore. Darò un'occhiata.
Christoph Hanck,

@amoeba, ho cercato di ottimizzare un po ', ma non pretendo di averlo fatto in modo intelligente, ho poca esperienza con l'ottimizzazione.
Christoph Hanck,

2
L'asimmetria che è da zero a tre cifre (quasi quattro) era molto per me; non è che un valore più preciso lo farà sembrare diverso. Se l'asimmetria attraverserà lo zero in quella zona ed è chiaro in quali direzioni modificare i valori se è necessaria una maggiore precisione, credo che sia sufficiente. Ma complimenti per lo sforzo aggiuntivo. (A proposito, è un bell'esempio.)
Glen_b -Reinstate Monica

9

Considera una distribuzione sulla metà positiva della linea reale che aumenta linearmente da 0 alla modalità e quindi è esponenziale a destra della modalità, ma è continua nella modalità.

Questa potrebbe essere definita una distribuzione triangolare-esponenziale (sebbene spesso assomigli un po 'a una pinna di squalo).

Sia la posizione della modalità e sia il parametro rate dell'esponenziale.θλ

All'aumentare di la distribuzione diventa progressivamente meno inclinata. Quando aumenta oltre il terzo momento passa da positivo a negativo:λθλθ6.15

Triangolare-esponenziale con zero asimmetria

Brizzi (2006) riferisce a questa famiglia di distribuzioni come distribuzione "a due facce" e discute questo punto di incrocio in cui l'asimmetria del terzo momento è zero. von Hippel (2005) presenta un esempio che è quasi a quel punto di crossover qui[1][2]

Il thread Distribuzioni non normali con zero asimmetria e zero curtosi in eccesso? ha alcuni esempi asimmetrici, incluso un piccolo esempio discreto e un altro continuo unimodale:

Miscela gaussiana unimodale con zero asimmetria

Le distribuzioni unimodali discrete - o equivalentemente, i campioni - con zero asimmetria sono abbastanza facili da costruire, di grandi o piccole dimensioni.

Ecco un esempio, che puoi trattare come un campione o (dividendo le frequenze grezze per 3000) come un pmf (i valori 'x' sono i valori presi, 'n' è il numero di volte in cui quel valore si verifica nel campione ):

x:  -2   -1    0    1    2    3    4    5    6    7    8    9   10
n: 496  498  562 1434    2    1    1    1    1    1    1    1    1

Un diagramma della funzione di massa di probabilità costruita da sopra

Questo esempio è costituito da distribuzioni in 3 punti:

x:          -2              1                  c
n:   c(c-1)(c+1)/6     c(c-1)(c+1)/3 - c       1

tutti diversi valori di tra 3 e 10. Questo parametrizzato (da ) 3 punti "atomo" ha e , che a sua volta significa che le miscele attraverso varie scelte di hanno nulla asimmetria. (Non puoi fare nulla di più piccolo di una distribuzione su tre punti che ha asimmetria e terzo momento centrale zero. Una raccolta di pezzi semplici su pochi punti, come questi creano blocchi ordinati da cui possono essere realizzate strutture più grandi.)ccinixi=0inixi3=0c

Esistono tutti gli altri "atomi" che si possano costruire, ma questo esempio usa solo questo tipo. Ad una combinazione di atomi come questi vengono aggiunti alcuni valori posizionati simmetricamente per riempire i buchi rimanenti e garantire l'unimodalità senza distruggere la struttura della media e del terzo momento.

[1] Brizzi, M. (2006),
"Un modello distorto che combina caratteristiche triangolari ed esponenziali: la distribuzione bifronte e le sue proprietà statistiche"
Austrian Journal of Statistics , 35 : 4, p455–462
http: //www.stat .tugraz.at / AJS / ausg064 /

[2] von Hippel, PT (2005),
"Mean, Median, and Skew: Correcting a Textbook Rule"
Journal of Statistics Education Volume 13, Number 2,
http://ww2.amstat.org/publications/jse/v13n2/ vonhippel.html


3
Potresti forse chiamarla "pinna di squalo" forse?
Glen_b

@Glen_b Davvero una pinna di squalo.
Alecos Papadopoulos,

2

Sicuro. Prova questo:

skew= function (x, na.rm = FALSE) 
 {
    if (na.rm)    x <- x[!is.na(x)]             #remove missing values
    sum((x - mean(x))^3)/(length(x) * sd(x)^3)  #calculate skew   
 }

set.seed(12929883) 
x = c(rnorm(100, 1, .1), rnorm(100, 3.122, .1), rnorm(100,5, .1), rnorm(100, 4, .1), rnorm(100,1.1, .1))

 skew(x)
 plot(density(x))

(Hai già fatto le cose difficili!)


1
carino mi piace. +1
gung - Ripristina Monica

4
Non è bimodale ... è terribilmente più -modal. Prova a tracciare la densità; curve(0.2*(dnorm(x, 1, .1) + dnorm(x, 3.122, .1) + dnorm(x, 5, .1) + dnorm(x, 4, .1) + dnorm(x, 1.1, .1)), 0,10)
ospite

1
I dati generati in questo modo non sono certamente unimodali. Tutto quello che devi fare per vedere è tagliare e incollare il tuo codice, alla lettera. In effetti, una miscela di variabili normalmente distribuite non sarà mai unimodale (a meno che, naturalmente, una delle proporzioni della miscela sia 1).
Macro

8
@Macro, non è corretto. Si veda, ad esempio, l'abstract di Roeder 1994 (JASA) per il noto risultato che "la densità di due normali miste non è bimodale a meno che i mezzi non siano separati da almeno 2 deviazioni standard". Se sono separati da meno di questo, la miscela è unimodale.
ospite

1
Hai ragione @guest. Mi ero dimenticato di quella possibilità quando ho pubblicato il mio post
Macro

2

Per zero asimmetria, abbiamo bisogno di o, equivalentemente,

E[(Xμσ)3]=0
E[(Xμσ)3|Xμ]+E[(Xμσ)3|X>μ]=0.

Ora, per data media e varianza, scegli due distribuzioni e con massa zero sul lato destro di e e definire in modo che corrisponda a se lasciato da e contrario. (Non conosci la notazione esatta per questo, qualcuno vuole aiutare?)Z μ E [ ( Y - μYZμ XYμ(μ-Z)

E[(Yμσ)3]=E[(Zμσ)3]
XYμ(μZ)

La distribuzione risultante sarà unimodale se i PDF di e stanno aumentando alla sinistra di (oltre ad essere zero alla destra di ).Z μ μYZμμ


1
Come garantite che la distribuzione sia unimodale?
Dilip Sarwate,

Grazie per averlo segnalato. I PDF di e dovranno aumentare rigorosamente fino a , quindi scendere a zero. Z μYZμ
krlmlr

Questa è l'idea giusta, ma ha ancora bisogno di un po 'di lavoro, perché può cambiare quando si combinano e . Y ZσYZ
whuber

@whuber: Accidenti. Sapevo che ci doveva essere qualche trappola ... :-)
krlmlr

2

La seguente distribuzione discreta è asimmetrica e presenta un'asimmetria nulla: Prob (-4) = 1/3, Prob (1) = 1/2, Prob (5) = 1/6. L'ho trovato nel documento di Doric et al., Qual Quant (2009) 43: 481-493; DOI 10.1007 / s11135-007-9128-9


+1 Si verifica ed è privo di importanza. Questo è l'esempio più semplice possibile.
whuber
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.