Spiegazione intuitiva per la densità della variabile trasformata?


37

Supponiamo che sia una variabile casuale con pdf . Quindi la variabile casuale ha il pdfXfX(x)Y=X2

fY(y)={12y(fX(y)+fX(y))y00y<0

Capisco il calcolo dietro questo. Ma sto cercando di pensare a un modo per spiegarlo a qualcuno che non conosce il calcolo. In particolare, sto cercando di spiegare perché il fattore appare in primo piano. Ci penserò io:1y

Supponiamo che abbia una distribuzione gaussiana. Quasi tutto il peso del suo pdf è tra i valori, ad esempio, e Ma che mappa 0 a 9 per Y . Quindi, il peso del pdf per X è stato esteso attraverso una più ampia gamma di valori nella trasformazione di Y . Pertanto, affinché f_Y (y) sia un vero pdf, il peso extra pesante deve essere ridotto del fattore moltiplicativo \ frac {1} {\ sqrt {y}}X33.YXYfY(y)1y

Come ti sembra?

Se qualcuno è in grado di fornire una spiegazione migliore del proprio o di collegarsi a uno in un documento o in un libro di testo, lo apprezzerei molto. Trovo questo esempio di trasformazione variabile in diversi libri introduttivi di statistiche / probabilità matematiche. Ma non trovo mai una spiegazione intuitiva con esso :(


Penso che la tua spiegazione sia corretta.
highBandWidth,

2
La spiegazione è giusta, ma è puramente qualitativa: la forma precisa del fattore moltiplicativo è ancora un mistero. La potenza di -1/2 appare semplicemente magicamente. Quindi, a un certo livello, devi fare la stessa cosa che fa Calculus: trova il tasso di cambiamento della funzione radice quadrata.
whuber

Risposte:


37

I PDF sono altezze ma sono usati per rappresentare la probabilità per area. Aiuta quindi ad esprimere un PDF in un modo che ci ricorda che l'area è uguale a altezza volte base.

Inizialmente l'altezza a qualsiasi valore è data dal PDF f X ( x ) . La base è il segmento infinitesimale d x , da cui la distribuzione (ovvero la misura di probabilità rispetto alla funzione di distribuzione ) è in realtà la forma differenziale, o "elemento di probabilità",xfX(x)dx

PEX(x)=fX(x)dx.

Questo, piuttosto che il PDF, è l'oggetto con cui vuoi lavorare sia concettualmente che praticamente, perché include esplicitamente tutti gli elementi necessari per esprimere una probabilità.

Quando ri-esprimiamo x in termini di y=x2 , i segmenti di base dx vengono allungati (o schiacciati): quadrando entrambe le estremità dell'intervallo da x a x+dx vediamo che la base dell'area y deve essere un intervallo di lunghezza

dy=(x+dx)2x2=2xdx+(dx)2.

Poiché il prodotto di due infinitesimi è trascurabile rispetto agli infinitesimi stessi, concludiamo

dy=2xdx, whence dx=dy2x=dy2y.

Stabilito questo, il calcolo è banale perché abbiamo appena inserito la nuova altezza e la nuova larghezza:

PEX(x)=fX(x)dx=fX(y)dy2y=PEY(y).

Poiché la base, in termini di y , è dy , qualunque cosa si moltiplichi deve essere l'altezza, che possiamo leggere direttamente dal medio termine come

12yfX(y)=fY(y).

Questa equazione PEX(x)=PEY(y) è effettivamente una conservazione della legge dell'area (= probabilità).

Two pdfs

Questo grafico mostra con precisione pezzi stretti (quasi infinitesimi) di due PDF correlati da y=x2 . Le probabilità sono rappresentate dalle aree ombreggiate. A causa della compressione dell'intervallo [0.32,0.45] tramite quadratura, l'altezza della regione rossa ( y , a sinistra) deve essere espansa proporzionalmente in modo che corrisponda all'area della regione blu ( x , a destra).


2
Adoro gli infinitesimi. Questa è una spiegazione meravigliosa. Pensare in termini di , che può essere visto chiaramente emergere dalla derivata della trasformazione, è molto più intuitivo di pensare in termini di 2x . Penso che sia qui il mio punto critico. y
lowndrul,

@whuber, credo che la prima riga dovrebbe essere ? È questo che intendi per pdf X ( x ) ? PS: anche curioso dei tuoi pensieri sulla mia risposta (sotto). P(X(x,x+dx))=fx(x)dxpdfX(x)
Carlos Cinelli,

@Carlos È un po 'più rigoroso esprimere l'idea come ho fatto all'inizio: il PDF è ciò per cui moltiplichi la misura di Lebesgue per ottenere la misura di probabilità data. dx
whuber

@whuber ma se il pdf è ciò che moltiplichi, allora è il termine , non il prodotto f x ( x ) d x come hai scritto, giusto? Non è chiaro il motivo per cui si chiama il prodotto f X ( x ) d x a pdf. fX(x)fx(x)dxfX(x)dx
Carlos Cinelli,

1
@Carlos: grazie; ora vedo il tuo punto. Ho apportato alcune modifiche per risolverlo.
whuber

11

Che ne dici se produco oggetti che sono sempre quadrati e conosco la distribuzione delle lunghezze laterali dei quadrati; cosa posso dire sulla distribuzione delle aree dei quadrati?

In particolare, se conosco la distribuzione di una variabile casuale , cosa posso dire di Y = X 2 ? Una cosa che puoi dire èXY=X2

FY(c)=P(Yc)=P(X2c)=P(cXc)=FX(c)FX(c).

Quindi viene stabilita una relazione tra il CDF di e il CDF di X ; qual è la relazione tra i loro PDF? Abbiamo bisogno di calcoli per quello. Prendere i derivati ​​di entrambe le parti ti dà i risultati desiderati.YX


2
(+1) Anche se questa non è una risposta completa, presenta un buon modo per trovare e mostra chiaramente perché è una somma di due pezzi, uno per ogni radice quadrata. fY
whuber

1
Non capisco perché pdf (x) = f (x) dx. Che dire di pdf (x) dx = f (x), density = prob mass/interval... cosa sto sbagliando?
Fernando,

2

Immagina di avere una popolazione e Y è un riassunto di quella popolazione. Quindi P(Y(y,y+Δy)) sta contando la proporzione di individui che hanno Y variabile nell'intervallo (y,y+Δy) . Puoi considerarlo come un "cestino" di dimensioni Δy e contiamo quante persone ci sono all'interno di quel cestino.

Ora dobbiamo ri-esprimere quegli individui in termini di un'altra variabile, X . Dato che sappiamo che Y e X sono correlati come Y=X2 , l'evento Y(y,y+Δy) è uguale all'evento X2(x2,(x+Δx)2) che è uguale all'evento X(|x|,|x|+Δx) or X(|x|Δx,|x|) . Pertanto, anche gli individui che si trovano nel cestino(y,y+Δy) devono trovarsi nei contenitori(|x|,|x|+Δx) e(|x|Δx,|x|)

P(Y(y,y+Δy))=P(X(|x|,|x|+Δx))+P(X(|x|Δx,|x|))

Ok, now let's get to the density. First, we need to define what a probability density is. As the name suggests, it is the proportion of individuals per area. That is, we count the share of individuals on that bin and divide by the size of the bin. Since we have established that the proportions of people are the same here, but the size of the bins have changed, we conclude the density will be different. But different by how much?

As we said, the probability density is the proportion of people in the bin divided by the size of the bin, thus the density of Y is given by fY(y):=P(Y(y,y+Δy))Δy. Analogously, the probability density of X is given by fX(x):=P(X(x,x+Δx))Δx.

From our previous result that the population in each bin is the same we then have that,

fY(y):=P(Y(y,y+Δy))Δy=P(X(|x|,|x|+Δx))+P(X(|x|Δx,|x|))Δy=fX(|x|)Δx+fX(|x|)ΔxΔy=ΔxΔy(fX(|x|)+fX(|x|))=ΔxΔy(fX(y)+fX(y))

That is, the density fX(y)+fX(y) changes by the factor ΔxΔy, which is the relative size of stretching or squeezing the bin size. In our case, since y=x2 we have that y+Δy=(x+Δx)2=x2+2xΔx+Δx2. If Δx is tiny enough we can ignore Δx2, which implies Δy=2xΔx and ΔxΔy=12x=12y, and that is why the factor 12y shows up in the transformation.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.