Distribuzioni gamma vs. lognormali


29

Ho una distribuzione osservata sperimentalmente che sembra molto simile a una distribuzione gamma o lognormale. Ho letto che la distribuzione lognormale è la distribuzione di probabilità entropia massima per una variabile casuale per la quale sono fissati la media e la varianza di . La distribuzione gamma ha proprietà simili?Xln(X)


2
Perché una tale proprietà avrebbe un valore nel decidere quale sarebbe un modello appropriato?
Glen_b -Restate Monica

@Glen_b Sono ancora un principiante quando si tratta di statistiche, quindi la mia conoscenza è piuttosto semplice. Osservando i grafici delle distribuzioni gamma e lognormali, qualitativamente sembrano molto simili. Sto cercando differenze quantitative tra i due. Ad esempio, quali sono alcuni esempi di applicazioni fisiche in cui si verificano distribuzioni gamma o lognormali?
OSE

In realtà, probabilmente non si verifica mai realmente; sono modelli straordinariamente semplici che a volte sono utili (se approssimativi) approssimazioni della realtà. Pubblicherò una risposta che discute alcune differenze qualitative.
Glen_b -Restate Monica

1
@glen_b: la ragione è che se stai misurando solo quelle statistiche allora la distribuzione minima presunta è unicamente la distribuzione esponenziale della famiglia con quelle statistiche sufficienti. Considerando che qualsiasi distribuzione potrebbe essere un modello di realtà scadente, se non si è liberi di scegliere quali misure vengono prese, questo è un modo eccellente di scegliere un modello.
Neil G

1
@Glen_b Immagino che la distribuzione lognormale dovrebbe apparire in alcune situazioni fisiche a causa del CLT.
Stéphane Laurent,

Risposte:


27

Per quanto riguarda le differenze qualitative, il lognormale e la gamma sono, come dici tu, abbastanza simili.

In effetti, in pratica sono spesso usati per modellare gli stessi fenomeni (alcune persone useranno una gamma in cui altri usano un lognormale). Entrambi sono, ad esempio, modelli a coefficiente di variazione costante (il CV per il lognormale è , per la gamma è ).eσ2-11/α

[Come può essere costante se dipende da un parametro, chiedi? Si applica quando si modella la scala (posizione per la scala del registro); per il lognormale, funge da parametro di scala, mentre per la gamma, la scala è il parametro che non è il parametro di forma (o è reciproco se si utilizza la parametrizzazione di forma-frequenza). Chiamerò il parametro scale per la distribuzione gamma β . I GLM gamma modellano la media ( μ = α β ) mantenendo costante α ; in tal caso μ è anche un parametro di scala. Un modello con μ variabile e rispettivamente α o σ costante avrà CV costante.]μβμ=αβαμμασ

Potresti trovare istruttivo osservare la densità dei loro registri , che spesso mostra una differenza molto chiara.

Il registro di una variabile casuale lognormale è ... normale. È simmetrico.

Il registro di una variabile gamma casuale è inclinato a sinistra. A seconda del valore del parametro shape, può essere piuttosto distorto o quasi simmetrico.

Ecco un esempio, con lognormale e gamma con media 1 e varianza 1/4. La trama in alto mostra le densità (gamma in verde, lognormale in blu) e quella inferiore mostra le densità dei registri:

gamma e lognormale, densità e densità del log

(È anche utile tracciare il registro della densità dei registri. Vale a dire, prendere una scala di registro sull'asse y sopra)

CV3+3CV2CV


+1. Sai se esiste una formula chiusa per l'asimmetria del registro di gamma? Per lognormale, l'asimmetria di log è chiaramente zero e mi chiedo se ci sia qualche espressione per la gamma. Wikipedia fornisce formule per la media e la varianza del log (gamma), ma non per l'asimmetria.
ameba dice di ripristinare Monica l'

0Xν-1e-μX(lnX)pdXp=2,3,4p=1Γ,ψζpcome derivato di una funzione gamma così presumibilmente è possibile andare più in alto. Quindi l'asimmetria è certamente fattibile ma non particolarmente "pulita". Se vuoi perseguirlo, potrei darti gli integrali.
Glen_b -Restate Monica

Tuttavia non abbiamo bisogno di valutare l'asimmetria per discernere il suo segno. Esaminare il registro della densità dei registri dovrebbe essere sufficiente per stabilire che poiché una parte domina chiaramente l'altra.
Glen_b

Grazie Glen. Ho deciso di pubblicarlo come una nuova domanda: stats.stackexchange.com/questions/312803 . Ho trascorso un po 'di tempo a cercare una risposta pronta ma non sono riuscito a trovarne nessuna, quindi potrebbe essere utile per il futuro averla scritta da qualche parte dove è facile da trovare. Potrebbe essere un po 'meglio per Math.SE, ma preferirei averlo qui, a dire il vero.
ameba dice di reintegrare Monica il

11

E(X)E(logX)

Per rispondere alla tua domanda sui processi fisici che generano queste distribuzioni: La distribuzione lognormale sorge quando il logaritmo di X è normalmente distribuito, ad esempio, se X è il prodotto di molti piccoli fattori. Se X è distribuito gamma, è la somma di molti variati distribuiti esponenzialmente. Ad esempio, il tempo di attesa per molti eventi di un processo di Poisson.


5
Non è necessario che "molti" variati esponenziali siano Gamma.
Stéphane Laurent,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.