Il pdf, il pmf e il cdf contengono le stesse informazioni?


17

Il pdf, il pmf e il cdf contengono le stesse informazioni?

Per me il pdf dà tutta la probabilità ad un certo punto (sostanzialmente l'area sotto la probabilità).

Il pmf fornisce la probabilità di un certo punto.

Il cdf dà la probabilità sotto un certo punto.

Quindi per me il pdf e il cdf hanno le stesse informazioni, ma il pmf non lo fa perché dà la probabilità di un punto xsulla distribuzione.

Risposte:


25

Quando viene fatta una distinzione tra funzione di probabilità e densità *, il pmf si applica solo a variabili casuali discrete, mentre il pdf si applica a variabili casuali continue.

* gli approcci formali possono comprendere entrambi e utilizzare un solo termine per essi

Il cdf si applica a tutte le variabili casuali, comprese quelle che non hanno né pdf né pmf.

inserisci qui la descrizione dell'immagine

(Una distribuzione mista non è l'unico caso di una distribuzione che non ha un pdf o pmf, ma è una situazione ragionevolmente comune - ad esempio, considera la quantità di pioggia in un giorno o la quantità di denaro pagata nei reclami su una polizza assicurativa sulla proprietà, che potrebbe essere modellata da una distribuzione continua a gonfiaggio zero)

Il cdf per una variabile casuale indica P ( X x )XP(Xx)

Il pmf per una variabile casuale discreta , dà P ( X = x ) .XP(X=X)

Il pdf non fornisce di per sé le probabilità , ma le probabilità relative; le distribuzioni continue non hanno probabilità puntuali. Per ottenere le probabilità dai pdf è necessario integrarsi in un intervallo o prendere una differenza di due valori cdf.

È difficile rispondere alla domanda "contengono le stesse informazioni" perché dipende da cosa intendi. Puoi passare da pdf a cdf (tramite integrazione) e da pmf a cdf (tramite riepilogo) e da cdf a pdf (tramite differenziazione) e da cdf a pmf (tramite differenziazione), quindi se esiste un pmf o un pdf, contiene le stesse informazioni del cdf.


1
Glen, potresti aiutarmi fornendo qualche riferimento in cui potrei leggere su "pdf che fornisce le probabilità relative"? È molto interessante e non ricordo di averlo visto nei miei libri. Grazie.
Alecos Papadopoulos,

@Alecos È semplicemente una spiegazione (forse mal formulata) del fatto che mentre non è una probabilità, poiché f ( x )f(x) è la probabilità di essere in ( x , x + d x ) , quindi f ( x ) / g ( x ) può essere considerato come il rapporto della probabilità che una variabile con densità f sia entro una distanza molto piccola di x al rapporto che una variabile con densità g è nello stesso intervallo. In questo senso esprime "probabilità relativa". f(x)dx(x,x+dx)f(x)/g(x)fXg
Glen_b -Restate Monica

Vedo. È certamente valido come approssimazione del rapporto di probabilità, e certamente presente nelle funzioni di densità empirica, dove le cose sono discrete per necessità.
Alecos Papadopoulos,

10

I PMF sono associati a variabili casuali discrete, PDF con variabili casuali continue. Per qualsiasi tipo di casuale di variabile casuale, il CDF esiste sempre (ed è unico), definito come Ora, a seconda del set di supporto della variabile casuale X , non è necessario che la densità (o la funzione di massa). (Si consideri la funzione Cantor Set e Cantor Function , la serie viene definita ricorsivamente rimuovendo il centro 1/3 dell'intervallo dell'unità, quindi ripetendo la procedura per gli intervalli (0, 1/3) e (2/3, 1), ecc. La funzione è definita come C ( x

FX(x)=P{Xx}.
X , se x è nel set Cantor, e il limite inferiore massimo nel set Cantor se x non è un membro.) La funzione Cantor è una funzione di distribuzione perfettamente valida, se si punta su C ( x ) = 0 se x < 0 e C ( x ) = 1 se 1 < x . Ma questo cdf non ha densità: C ( x ) è continuo ovunque ma la sua derivata è 0 quasi ovunque. Nessuna densità rispetto a qualsiasi misura utile.C(x)=xxxC(x)=0x<0C(x)=11<xC(x)

Quindi, la risposta alla tua domanda è, se esiste una funzione di densità o di massa, allora è una derivata del CDF rispetto a qualche misura. In questo senso, portano le "stesse" informazioni. MA, PDF e PMF non devono esistere. I CDF devono esistere.


2
Dennis, puoi chiarire cosa intendi con la frase " Nessuna densità rispetto a qualsiasi misura "? Certamente ha una densità (uniforme!) Rispetto a se stessa.
cardinale

@cardinal: Ci proverò, ma non so che avrà senso se non hai studiato qualche analisi reale. Se guardi alcuni libri più vecchi sulle statistiche matematiche (ad esempio, le statistiche matematiche di Freund ), vedrai i PMF chiamati "densità". Il nome "densità" è giustificato dalla misura di probabilità sullo spazio misurabile ( Ω , σ ( Ω ) , μ ) è la base del CDF (vedi il commento di Joel). La densità è il derivato Radon-Nikodym di μ rispetto ad alcune misure (di solito misura di Lesbesgue o misura di conteggio). In questo caso, C ( x )μ(Ω,σ(Ω),μ)μC(x)non ha derivati ​​RN.
Dennis,

3
@cardinale (continua): la misura di probabilità è uniforme sul Cantor Set, ma questa è una strana bestia che non sono nemmeno sicuro di come sia l' algebra . Forse avrei dovuto dire: "Nessuna densità rispetto a qualsiasi misura utile". σ
Dennis,

2

Le altre risposte indicano il fatto che i CDF sono fondamentali e devono esistere, mentre i PDF e i PMF non esistono e non necessariamente esistono.

S1

Mi sembra che la risposta sia che la funzione fondamentale è la misura di probabilità , che associa ogni sottoinsieme (considerato) dello spazio campione a una probabilità. Quindi, quando esistono, CDF, PDF e PMF derivano dalla misura di probabilità.


1
Per come l'ho visto, la maggior parte dei libri di testo definisce "variabile casuale" come una mappatura da uno spazio campione ai numeri reali. In sostanza, una "variabile casuale" ha un valore reale.
Neil G,

1
(R,B,F)(Ω,σ(Ω),μ)Ωμ
FX(x)=μ{ω|X(ω)x}.
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.