Esiste una distribuzione a forma di plateau?


30

Sto cercando una distribuzione in cui la densità di probabilità diminuisca rapidamente dopo qualche punto di distanza dalla media, o in parole mie una "distribuzione a forma di plateau".

Qualcosa tra il gaussiano e l'uniforme.


8
Potresti sommare un camper gaussiano e un camper uniforme.
StrongBad

3
A volte si sente parlare delle cosiddette distribuzioni platicurtiche .
JM non è uno statistico il

Risposte:


53

È possibile che si stia cercando una distribuzione nota con i nomi di normale generalizzato (versione 1) , distribuzione di Subbotin o distribuzione di potenza esponenziale. È parametrizzato per posizione , scala e forma con pdfσ βμσβ

β2σΓ(1/β)exp[(|xμ|σ)β]

come puoi notare, per assomiglia e converge alla distribuzione di Laplace, con converge alla normalità e quando alla distribuzione uniforme.β = 2 β = β=1β=2β=

inserisci qui la descrizione dell'immagine

Se stai cercando un software che lo abbia implementato, puoi controllare la normalplibreria per R (Mineo e Ruggieri, 2005). La cosa bella di questo pacchetto è che, tra le altre cose, implementa la regressione con errori normalmente distribuiti, cioè minimizzando la norma .Lp


Mineo, AM, & Ruggieri, M. (2005). Uno strumento software per la distribuzione esponenziale dell'alimentazione: il pacchetto normalp. Journal of Statistical Software, 12 (4), 1-24.


20

Il commento di StrongBad è davvero un buon suggerimento. La somma di un camper uniforme e di un gaussiano può darti esattamente quello che stai cercando se scegli i parametri giusti. E in realtà ha una soluzione a forma chiusa ragionevolmente bella.

Il pdf di questa variabile è dato dall'espressione:

14a[erf(x+aσ2)erf(xaσ2)]

σa è il "raggio" del RV uniforme a media zero. è la deviazione standard del camper gaussiano a media zero.σ

PDF


3
Riferimento: Bhattacharjee, GP, Pandit, SNN e Mohan, R. 1963. Catene dimensionali che coinvolgono distribuzioni di errori rettangolari e normali. Technometrics, 5, 404–406.
Tim

15

C'è un numero infinito di distribuzioni "a forma di plateau".

Cercavi qualcosa di più specifico di "tra il gaussiano e l'uniforme"? È piuttosto vago.

Eccone una semplice: puoi sempre attaccare una mezza normale ad ogni estremità di una divisa:

Densità con centro uniforme e code gaussiane

Puoi controllare la "larghezza" dell'uniforme rispetto alla scala della normale in modo da poter avere plateau più ampi o più stretti, dando un'intera classe di distribuzioni, che includono il gaussiano e l'uniforme come casi limitanti.

La densità è:

h2πσe12σ2(xμ+w/2)2Ixμw/2+h2πσIμw/2<xμ+w/2+h2πσe12σ2(xμw/2)2Ix>μ+w/2

doveh=11+w/(2πσ)

Come per fixed , ci avviciniamo all'uniforme su e come per fixed ci avviciniamo a .σ0w(μw/2,μ+w/2)w0σN(μ,σ2)

Ecco alcuni esempi (con in ogni caso):μ=0

Trama di vari esempi di questa uniforme dalla coda gaussiana

Potremmo forse definire questa densità una "uniforme dalla coda gaussiana".


1
Ach! Mi piace frequentare le palle formali in divisa Gausian dalla coda! ;)
Alexis,

7

Vedi la mia distribuzione "Devil's tower" qui [1]:

| x | < 0.9399 f ( x ) = 0.2945 / x 2 0.9399 | x | < 2.3242 f ( x ) = 0 2.3242 | x |f(x)=0.3334 , per ; , per ; e , per.|x|<0.9399
f(x)=0.2945/x20.9399|x|<2.3242
f(x)=02.3242|x|

Funzione di densità della torre del diavolo con cima piatta, lati convessi, tagliati agli estremi

La distribuzione "slip-dress" è ancora più interessante.

È facile costruire distribuzioni con qualsiasi forma tu voglia.

[1]: Westfall, PH (2014)
"Kurtosis as Peakedness, 1905 - 2014. PIR"
Em. Statistica. 68 (3): 191–195. doi: 10.1080 / 00031305.2014.917055
accesso pubblico pdf: http://www.ncbi.nlm.nih.gov/pmc/articles/PMC4321753/pdf/nihms-599845.pdf


Ciao Peter - Mi sono preso la libertà di dare la funzione e di inserire un'immagine, oltre a fornire un riferimento completo. (Se la memoria serve penso che Kendall e Stuart forniscano i dettagli di un simile debunking nel loro testo classico. Se ricordo bene - è passato molto tempo - credo che discutano anche che non è una coda pesante)
Glen_b -Reinstate Monica

Grazie Glen_b. Non ho mai detto che la curtosi misurasse ciò che misurano i numeri dell'indice di coda. Piuttosto, il mio articolo dimostra che la curtosi è, per una classe molto ampia di distribuzioni, quasi uguale a E (Z ^ 4 * I (| Z |> 1)). Pertanto, la kurtosi non dice chiaramente nulla del "picco", che si trova generalmente nell'intervallo {Z: | Z | <1}. Piuttosto, è determinato principalmente dalle code. Chiamalo E (Z ^ 4 * I (| Z |> 1)) se il termine "coda pesante" ha un altro significato.
Peter Westfall,

Inoltre, @Glen_b a quale indice di coda ti riferisci? Ce ne sono infiniti. Gli incroci di coda non definiscono correttamente la "coda". Secondo alcune definizioni di attraversamento della coda della pesantezza della coda, N (0,1) è più "a coda pesante" di .9999 * U (-1,1) + .0001 * U (-1000,1000), sebbene quest'ultima sia ovviamente più pesante coda, nonostante abbia code finite. E, a proposito, quest'ultimo ha una curtosi estremamente elevata, a differenza di N (0,1).
Peter Westfall,

Non riesco a trovarmi a dire "indice di coda" da nessuna parte nel mio commento; Non sono del tutto sicuro di cosa ti riferisca quando dici "a quale indice di coda ti riferisci". Se intendi la punta della coda pesante, la cosa migliore da fare è controllare cosa dicono effettivamente Kendall e Stuart; Credo che in realtà confrontino il rapporto asintotico di densità per variabili simmetriche standardizzate, ma forse potrebbero essere state funzioni di sopravvivenza; il punto era il loro, non il mio
Glen_b -Restate Monica

Strano. Bene, in ogni caso, Kendall e Stuart hanno sbagliato. La kurtosi è ovviamente una misura del peso della coda, come dimostrano i miei teoremi.
Peter Westfall,

5

Molte belle risposte. La soluzione qui proposta ha 2 caratteristiche: (i) che ha una forma funzionale particolarmente semplice, e (ii) che la distribuzione risultante produce necessariamente un pdf a forma di plateau (non solo come un caso speciale). Non sono sicuro che questo abbia già un nome in letteratura, ma assente lo stesso, chiamiamolo una distribuzione Plateau con pdf :f(x)

f(x)=k11+x2afor xR

dove:

  • il parametro è un numero intero positivo ea
  • k è una costante di integrazione: k=aπsin(π2a)

Ecco un grafico del pdf, per diversi valori del parametro :a

inserisci qui la descrizione dell'immagine

.

Quando il parametro diventa grande, la densità tende verso una distribuzione Uniforme (-1,1). La seguente trama si confronta anche con una normale (tratteggiata grigia):a

inserisci qui la descrizione dell'immagine


3

Un altro ( EDIT : l'ho semplificato ora. EDIT2 : l'ho semplificato ulteriormente, anche se ora l'immagine non riflette davvero questa equazione esatta):

f(x)=13αlog(cosh(αa)+cosh(αx)cosh(αb)+cosh(αx))

Clunky, lo so, ma qui ho approfittato del fatto che avvicina a una linea quando aumenta.xlog(cosh(x))x

Fondamentalmente hai il controllo su quanto è regolare la transizione ( ). Se e vi garantisco che è una densità di probabilità valida (somme a 1). Se scegli altri valori, dovrai rinormalizzarli.a = 2 b = 1alphaa=2b=1


Ecco un po 'di codice di esempio in R:

f = function(x, a, b, alpha){
  y = log((cosh(2*alpha*pi*a)+cosh(2*alpha*pi*x))/(cosh(2*alpha*pi*b)+cosh(2*alpha*pi*x)))
  y = y/pi/alpha/6
  return(y)
}

fè la nostra distribuzione. Tracciamolo per una sequenza dix

plot(0, type = "n", xlim = c(-5,5), ylim = c(0,0.4))
x = seq(-100,100,length.out = 10001L)

for(i in 1:10){
  y = f(x = x, a = 2, b = 1, alpha = seq(0.1,2, length.out = 10L)[i]); print(paste("integral =", round(sum(0.02*y), 3L)))
  lines(x, y, type = "l", col = rainbow(10, alpha = 0.5)[i], lwd = 4)
}
legend("topright", paste("alpha =", round(seq(0.1,2, length.out = 10L), 3L)), col = rainbow(10), lwd = 4)

Uscita console:

#[1] "integral = 1"
#[1] "integral = 1"
#[1] "integral = 1"
#[1] "integral = 1"
#[1] "integral = 1"
#[1] "integral = 1"
#[1] "integral = 1"
#[1] "integral = NaN" #I suspect underflow, inspecting the plots don't show divergence at all
#[1] "integral = NaN"
#[1] "integral = NaN"

E trama:

La mia distribuzione basata su log cosh

Potresti cambiare ae b, rispettivamente, circa l'inizio e la fine della pendenza, ma poi sarebbe necessaria un'ulteriore normalizzazione, e non l'ho calcolata (ecco perché sto usando a = 2e b = 1nella trama).


2

Se stai cercando qualcosa di molto semplice, con un plateau centrale e i lati di una distribuzione triangolare, puoi ad esempio combinare N distribuzioni triangolari, N a seconda del rapporto desiderato tra il plateau e la discesa. Perché triangoli, perché le loro funzioni di campionamento esistono già nella maggior parte delle lingue. Ordina casualmente da uno di essi.

In R ciò darebbe:

library(triangle)
rplateau = function(n=1){
  replicate(n, switch(sample(1:3, 1), rtriangle(1, 0, 2), rtriangle(1, 1, 3), rtriangle(1, 2, 4)))
}
hist(rplateau(1E5), breaks=200)

inserisci qui la descrizione dell'immagine inserisci qui la descrizione dell'immagine


2

Eccone una bella: il prodotto di due funzioni logistiche.

(1/B) * 1/(1+exp(A*(x-B))) * 1/(1+exp(-A*(x+B)))

Questo ha il vantaggio di non essere a tratti.

B regola la larghezza e A regola la pendenza della discesa. Di seguito sono mostrati B = 1: 6 con A = 2. Nota: non ho avuto il tempo di capire come normalizzare correttamente questo.

Distribuzione altopiano

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.