Immagina di avere una popolazione e Y è un riassunto di quella popolazione. Quindi P(Y∈(y,y+Δy)) sta contando la proporzione di individui che hanno Y variabile nell'intervallo (y,y+Δy) . Puoi considerarlo come un "cestino" di dimensioni Δy e contiamo quante persone ci sono all'interno di quel cestino.
Ora dobbiamo ri-esprimere quegli individui in termini di un'altra variabile, X . Dato che sappiamo che Y e X sono correlati come Y=X2 , l'evento Y∈(y,y+Δy) è uguale all'evento X2∈(x2,(x+Δx)2) che è uguale all'evento X∈(|x|,|x|+Δx) or X∈(−|x|−Δx,−|x|) . Pertanto, anche gli individui che si trovano nel cestino(y,y+Δy) devono trovarsi nei contenitori(|x|,|x|+Δx) e(−|x|−Δx,−|x|)
P(Y∈(y,y+Δy))=P(X∈(|x|,|x|+Δx))+P(X∈(−|x|−Δx,−|x|))
Ok, now let's get to the density. First, we need to define what a probability density is. As the name suggests, it is the proportion of individuals per area. That is, we count the share of individuals on that bin and divide by the size of the bin. Since we have established that the proportions of people are the same here, but the size of the bins have changed, we conclude the density will be different. But different by how much?
As we said, the probability density is the proportion of people in the bin divided by the size of the bin, thus the density of Y is given by fY(y):=P(Y∈(y,y+Δy))Δy. Analogously, the probability density of X is given by fX(x):=P(X∈(x,x+Δx))Δx.
From our previous result that the population in each bin is the same we then have that,
fY(y):=P(Y∈(y,y+Δy))Δy=P(X∈(|x|,|x|+Δx))+P(X∈(−|x|−Δx,−|x|))Δy=fX(|x|)Δx+fX(−|x|)ΔxΔy=ΔxΔy(fX(|x|)+fX(−|x|))=ΔxΔy(fX(y√)+fX(−y√))
That is, the density fX(y√)+fX(−y√) changes by the factor ΔxΔy, which is the relative size of stretching or squeezing the bin size. In our case, since y=x2 we have that y+Δy=(x+Δx)2=x2+2xΔx+Δx2. If Δx is tiny enough we can ignore Δx2, which implies Δy=2xΔx and ΔxΔy=12x=12y√, and that is why the factor 12y√ shows up in the transformation.