Perché il CDF di un campione è distribuito uniformemente


17

Ho letto qui che, dato un campione da una distribuzione continua con cdf F X , il campione corrispondente a U i = F X ( X i ) segue una distribuzione uniforme standard.X1,X2,...,XnFXUi=FX(Xi)

Ho verificato questo usando simulazioni qualitative in Python e sono stato facilmente in grado di verificare la relazione.

import matplotlib.pyplot as plt
import scipy.stats

xs = scipy.stats.norm.rvs(5, 2, 10000)

fig, axes = plt.subplots(1, 2, figsize=(9, 3))
axes[0].hist(xs, bins=50)
axes[0].set_title("Samples")
axes[1].hist(
    scipy.stats.norm.cdf(xs, 5, 2),
    bins=50
)
axes[1].set_title("CDF(samples)")

Risultato nel seguente diagramma:

Grafico che mostra il campione di una distribuzione normale e il cdf del campione.

Non riesco a capire perché questo accada. Presumo che abbia a che fare con la definizione del CDF e la sua relazione con il PDF, ma mi manca qualcosa ...

Gradirei se qualcuno potesse indicarmi qualche lettura sull'argomento o aiutarmi a ottenere qualche intuizione sull'argomento.

EDIT: Il CDF è simile al seguente:

CDF della distribuzione campionata


2
Calcola il cdf di . FX(X)
Zhanxiong,

2
Troverai una prova di questa proprietà (per camper continui) in qualsiasi libro sulla simulazione poiché questa è la base del metodo inverso di simulazione cdf.
Xi'an,

2
Prova anche a trasformare integralmente
Zachary Blumenfeld il

1
@ Xi'an È bene sottolineare che la conclusione vale solo per variabili casuali continue. A volte questo risultato viene erroneamente utilizzato per variabili casuali discrete. D'altra parte, si noti anche che molte prove coinvolgono il passaggio in cui assume la stretta monotonicità di F , che è anche un presupposto troppo forte. Il seguente collegamento fornisce una sintesi rigorosa su questo argomento: people.math.ethz.ch/~embrecht/ftp/generalized_inverse.pdfP(F(X)x)=P(XF1(x))F
Zhanxiong

@Zhanxiong l'unica condizione necessaria per è che sia càdlàg. F
AdamO,

Risposte:


19

Supponiamo che sia continuo e in aumento. Definisci Z = F X ( X ) e nota che Z assume valori in [ 0 , 1 ] . Quindi F Z ( x ) = P ( F X ( X ) x ) = P ( X F - 1 X ( x ) ) = F X ( F -FXZ=FX(X)Z[0,1]

FZ(x)=P(FX(X)x)=P(XFX1(x))=FX(FX1(x))=x.

U[0,1]

FU(x)=RfU(u)du=0xdu=x.

FZ(x)=FU(x)x[0,1]


Ne segue che Z ha una distribuzione uniforme (0, 1)?
StatsSorceress

Z(0,1).

8

F(x)F(x)FxF1x=F1(p)xpFF1=λF1F

Fa<bP(F1(a)<x<F1(b))=P(a<F(X)<b)=ba


Y=F(X)
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.