Wolfram Mathworld commette un errore descrivendo una distribuzione di probabilità discreta con una funzione di densità di probabilità?


14

Di solito una distribuzione di probabilità su variabili discrete è descritta usando una funzione di massa di probabilità (PMF):

Quando si lavora con variabili casuali continue, descriviamo le distribuzioni di probabilità utilizzando una funzione di densità di probabilità (PDF) anziché una funzione di massa di probabilità.

- Deep Learning di Goodfellow, Bengio e Courville

Tuttavia, Wolfram Mathworld sta usando PDF per descrivere la distribuzione di probabilità su variabili discrete:

inserisci qui la descrizione dell'immagine

È un errore? o non ha molta importanza?


5
È sciatto, secondo me, ma non molto importante. È persino difendibile se si avvicinano alla probabilità dal punto di vista della teoria della misura, anche se sembra un po 'troppo per un'introduzione al lancio di una moneta. (Abbastanza strano, non sembrano avere un articolo sui PMF.)
Dave,

9
un pmf è una densità rispetto alla misura del conteggio
Xi'an,

3
Quando si discute della teoria della probabilità a livello di spazio di misura specificato da 3 elementi, pdf e pmf non hanno differenze, quindi pmf viene eliminato. Tutte le distribuzioni possono essere specificate in pdf. Wolfram è un sito Web di matematica, quindi non sorprende che utilizzino matematica di alto livello per parlare di probabilità. Ecco una buona lettura gratuita. stat.washington.edu/~pdhoff/courses/581/LectureNotes/…
user158565

Risposte:


30

Non è un errore: nel trattamento formale della probabilità, attraverso la teoria della misura, una funzione di densità di probabilità è una derivata della misura di probabilità di interesse, presa rispetto a una "misura dominante" (detta anche "misura di riferimento"). Per distribuzioni discrete su numeri interi, la funzione di massa di probabilità è una funzione di densità rispetto alla misura di conteggio . Poiché una funzione di massa di probabilità è un tipo particolare di funzione di densità di probabilità, a volte troverai riferimenti come questo che si riferiscono ad essa come una funzione di densità e non hanno torto a farvi riferimento in questo modo.

Nel discorso ordinario su probabilità e statistica, si evita spesso questa terminologia e si distingue tra "funzioni di massa" (per variabili casuali discrete) e "funzioni di densità" (per variabili casuali continue), al fine di distinguere le distribuzioni discrete e continue. In altri contesti, in cui si affermano aspetti olistici della probabilità, è spesso meglio ignorare la distinzione e riferirsi ad entrambi come "funzioni di densità".


Grazie per la tua risposta. Fa treatment"Nel trattamento formale della probabilità" media notazione, prospettiva, convention o qualcos'altro?
czlsws,

Quando parlo qui del "trattamento formale" mi riferisco alle basi moderne della teoria della probabilità, che è un sottoinsieme della teoria delle misure. Questa è la teoria matematica che è accettata come base formale della probabilità.
Ripristina Monica il

"una funzione di densità di probabilità è una derivata della misura di probabilità di interesse" Mi sembra che in un certo senso sia più un "anti-integrale" che un derivato. Esistono PDF discontinui, come la distribuzione uniforme, e le distribuzioni discrete possono essere trattate come somme delle funzioni delta di Dirac. In quei casi, si dovrebbe generalizzare il concetto di derivato ben oltre la normale comprensione per applicarlo.
Accumulo

@Accumulazione - in che modo la distribuzione uniforme è discontinua? ... e la teoria della misura è un trattamento molto più generale di integrazione e differenziazione rispetto alla normale comprensione di Calc I e II.
jbowman,

@Accumulazione: Sì, è una caratterizzazione equa, e infatti, questo è ciò che viene fatto. Tecnicamente la densità è un derivato Radon-Nikodym , che in effetti è un tipo di "anti-integrale" del tipo che descrivi.
Ripristina Monica il

5

Oltre alla risposta più teorica in termini di teoria delle misure, è anche conveniente non distinguere tra pmfs e pdf nella programmazione statistica. Ad esempio, R ha una vasta gamma di distribuzioni integrate. Per ogni distribuzione, ha 4 funzioni. Ad esempio, per la distribuzione normale (dal file della guida):

dnorm gives the density, pnorm gives the distribution function, qnorm gives the quantile function, and rnorm generates random deviates.

Gli utenti R diventano rapidamente abituati ai d,p,q,rprefissi. Sarebbe fastidioso se dovessi fare qualcosa come drop de use, mad esempio la distribuzione binomiale. Invece, tutto è come un utente R si aspetterebbe:

dbinom gives the density, pbinom gives the distribution function, qbinom gives the quantile function and rbinom generates random deviates.

3
scipy.statsdistingue, alcuni oggetti hanno un pdfmetodo e altri hanno un pmfmetodo. Mi dà davvero fastidio!
Matthew Drury,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.