Qual è il significato intuitivo dietro il collegamento di una variabile casuale nel proprio pdf o cdf?


9

Un pdf è solitamente scritto come , dove la minuscola viene trattata come una realizzazione o un risultato della variabile casuale che ha quel pdf. Allo stesso modo, un cdf è scritto come , che ha il significato . Tuttavia, in alcune circostanze, come la definizione della funzione score e questa derivazione secondo cui il cdf è distribuito uniformemente , sembra che la variabile casuale sia inserita nel proprio pdf / cdf; così facendo, otteniamo una nuova variabile casuale ox X F X ( x ) P ( X < x )f(x|θ)xXFX(x)P(X<x)X Z = F X ( X )Y=f(X|θ)Z=FX(X). Non penso che possiamo chiamarlo più un pdf o un cdf poiché ora è una variabile casuale stessa, e in quest'ultimo caso, l'interpretazione " sembra assurda.FX(X)=P(X<X)

Inoltre, in quest'ultimo caso, non sono sicuro di comprendere l'affermazione "il cdf di una variabile casuale segue una distribuzione uniforme". Il cdf è una funzione, non una variabile casuale, e quindi non ha una distribuzione. Piuttosto, ciò che ha una distribuzione uniforme è la variabile casuale trasformata usando la funzione che rappresenta il proprio cdf, ma non vedo perché questa trasformazione sia significativa. Lo stesso vale per la funzione score, in cui stiamo inserendo una variabile casuale nella funzione che rappresenta la sua probabilità logaritmica.

Ho distrutto il mio cervello per settimane cercando di trovare un significato intuitivo dietro queste trasformazioni, ma sono bloccato. Qualsiasi approfondimento sarebbe molto apprezzato!


4
La notazione potrebbe confonderti. Ad esempio, è esattamente significativo come applicare qualsiasi funzione misurabile a sarebbe. Per una corretta interpretazione dovrai essere molto chiaro su cosa sia una variabile casuale . Per ogni variabile casuale la funzione per è chiaramente una variabile casuale e quindi ha una distribuzione(Notare i due significati distinti del simbolo " " in " .") è uniforme se e solo se ha una distribuzione continua. X X : Ohm R , Y : ω F X ( X ( ω ) ) ω Ohm F Y . X F X ( X ) F Y XFX(X)XX:ΩR,
Y:ωFX(X(ω))
ωΩFY.XFX(X)FYX
whuber

1
Questo non è davvero un problema teorico della misura: per capirlo, puoi tranquillamente ignorare tutti i riferimenti alla "misurabilità". Potresti trarre vantaggio dallo studio di una piccola teoria dell'insieme all'inizio della tua carriera universitaria: è qui che la maggior parte delle persone impara cosa significano veramente questa terminologia e notazione matematica di base (e onnipresente), quindi è meglio non rimandare l'apprendimento.
whuber

Forse una parola sul perché si dovrebbe fare una cosa folle come questa: inserire un camper nella propria densità !!?! Un esempio: supponiamo che tu voglia stimare la densità di X, quindi potresti misurare quanto sei bravo integrando over ma questo è “ingiusto”: non otterrai mai una buona approssimazione quando non hai molti esempi di dati (vale a dire la densità reale è piccola). Quindi, una valutazione "equa" sarebbe quella di ponderare il termine con la vera densità. Questo è più o meno l'effetto dell'inserimento di camper nelle proprie densità ...f(x)fX(x)
Fabian Werner,

Risposte:


8

Come dici tu, qualsiasi funzione (misurabile) di una variabile casuale è essa stessa una variabile casuale. È più semplice pensare a e come "qualsiasi vecchia funzione". Hanno solo delle belle proprietà. Ad esempio, se è un RV esponenziale standard, allora non c'è nulla di particolarmente strano nella variabile casuale Succede proprio che . Il fatto che ha una distribuzione uniforme (dato che è un continuo RV) può essere visto per il caso generale ricavando la CDF di .F ( x ) X Y = 1 - e - X Y = F X ( X ) Y X Yf(x)F(x)X

Y=1eX
Y=FX(X)YXY

FY(y)=P(Yy)=P(FX(X)y)=P(XFX1(y))=FX(FX1(y))=y

Che è chiaramente il CDF di una variabile casuale . Nota: questa versione della prova presuppone che sia strettamente crescente e continuo, ma non è troppo difficile mostrare una versione più generale.U(0,1)FX(x)


1
La tua conclusione non è corretta per la più strettamente crescente : hai assunto è l'identità, ma non è sempre così. FXFXFX1
whuber

Si Grazie. La variabile casuale deve chiaramente essere continua. Mi sto perdendo qualcosa adesso? X
Knrumsey,

1
FX non deve essere biiettivo. Prendiamo ad esempio il caso in cui stesso ha una distribuzione uniforme! La chiusura dell'immagine di deve essere l'intero intervallo Questa è essenzialmente la definizione di una distribuzione continua. XFX[0,1].
whuber

11

Una trasformazione di una variabile casuale mediante una funzione misurabile è un'altra variabile casuale cui distribuzione è data dalla trasformazione di probabilità inversa per tutti i set tale che è misurabile sotto la distribuzione di .XT:XYY=T(X)

P(YA)=P(X{x;T(x)A})=defP(XT1(A))
A{x;T(x)A}X

Questa proprietà si applica al caso speciale quando è il cdf della variabile casuale : è una nuova variabile casuale che prende le sue realizzazioni in . Accade che sia distribuito come Uniform quando è continuo. (Se è discontinuo, l'intervallo di non è più . Ciò che accade sempre è che quando è uniforme , allora ha la stessa distribuzione di , doveFX:X[0,1]XY=FX(X)[0,1]YU([0,1])FXFXY=FX(X)[0,1]UU([0,1])FX(U)XFX indica l'inverso generalizzato di . Quale è un modo formale per (a) comprendere le variabili casuali come trasformazioni misurabili di un fondamentale poiché è una variabile casuale con cdf e (b ) genera variabili casuali da una determinata distribuzione con cdf .)FXωΩX(ω)=FX(ω)FXFX

Per comprendere il paradosso di , prendi la rappresentazione se è la misura dominante e la densità corrispondente. Quindi è una variabile casuale dal limite superiore del l'integrale è casuale. (Questa è l'unica parte casuale dell'espressione.) L'apparente contraddizione in è dovuta a una confusione nelle notazioni. Per essere correttamente definito, sono necessarie due versioni indipendenti della variabile casuale , eP(XX)

FX(x)=P(Xx)=0xdFX(x)=0xfX(x)dλ(x)
dλfX
FX(X)=0XdFX(x)=0XfX(x)dλ(x)
P(XX)XX1X2, nel qual caso la variabile casuale è definita da la probabilità calcolata per la distribuzione di .FX(X1)
FX(X1)=PX2(X2X1)
X2

La stessa osservazione si applica alla trasformazione per densità (pdf), , che è una nuova variabile casuale, tranne per il fatto che non ha una distribuzione fissa quando varia. È comunque utile a scopi statistici quando si considera ad esempio un rapporto di verosimiglianza che 2 x logaritmo è approssimativamente un variabile casuale sotto alcune condizioni.fX(X)fXfX(X|θ^(X))/fX(X|θ0)χ2

E lo stesso vale per la funzione score che è una variabile casuale tale che la sua aspettativa è zero se presa al vero valore del parametro , ovvero,

logfX(X|θ)θ
θ
Eθ0[logfX(X|θ0)θ]=logfX(x|θ0)θfX(x|θ0)dλ(x)=0

[Risposta digitata mentre @whuber e @knrumsey scrivevano le rispettive risposte!]


Potresti spiegare a parole qual è il significato / interpretazione ? Mi sembra ancora che dire "il cdf di un camper ha una distribuzione uniforme" non ha alcun senso. FX(X1)=P(X2X1)
mai

Il cdf di un rv non è la stessa cosa della trasformazione di un rv dal cdf di questo rv, vale a dire . X F X ( X )FXXFX(X)
Xi'an,

Sì, sono d'accordo che non sono la stessa cosa. Nel primo caso non è un camper, mentre nel secondo caso è un camper Ho ragione?
mai

Sì, che si riferisce ai diversi significati di inF X ( X )XFX(X)
Xi'an,

Potresti spiegare cosa intendi con "l'attesa è zero se presa al vero valore del parametro ? Sembra che sia trattata come una variabile qui. Cosa cambia se non è al suo" vero valore "?θ θθθθ
mai
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.