Aspettativa condizionale di R al quadrato


17

Considera il modello lineare semplice:

yy = X ββ + ϵ

yy=Xββ+ϵ

dove ϵ ii . io . d .N ( 0 , σ 2 )ϵii.i.d.N(0,σ2) e X R n × pXRn×p , p 2p2 e XX contiene una colonna di costanti.

La mia domanda è, dato E ( X X )E(XX) , e , esiste una formula per un limite superiore non banale su *? (supponendo che il modello sia stato stimato da OLS).β σ E ( R 2 )βσE(R2)

* Ho ipotizzato, scrivendo questo, che ottenere stesso non sarebbe possibile.E ( R 2 )E(R2)

EDIT1

usando la soluzione derivata da Stéphane Laurent (vedi sotto) possiamo ottenere un limite superiore non banale su . Alcune simulazioni numeriche (sotto) mostrano che questo limite è in realtà piuttosto stretto.E ( R 2 )E(R2)

Stéphane Laurent ha derivato quanto segue: dove è una distribuzione beta non centrale con parametro di non centralità conR 2B ( p - 1 , n - p , λ ) B ( p - 1 , n - p , λ ) λR2B(p1,np,λ)B(p1,np,λ)λ

λ = | | X β - E ( X ) β 1 n | | 2σ 2

λ=||XβE(X)β1n||2σ2

Così

E ( R 2 ) = E ( χ 2 p - 1 ( λ )χ 2 p - 1 ( λ ) + χ 2 n - p )E(χ 2 p - 1 (λ))E ( χ 2 p - 1 ( λ ) ) + E ( χ 2 n - p )

E(R2)=E(χ2p1(λ)χ2p1(λ)+χ2np)E(χ2p1(λ))E(χ2p1(λ))+E(χ2np)

dove χ 2 k ( λ ) è un non-centrale χ 2 con parametro λ e k gradi di libertà. Quindi un limite superiore non banale per E ( R 2 ) èχ2k(λ)χ2λkE(R2)

λ + p - 1λ + n - 1

λ+p1λ+n1

è molto stretto (molto più stretto di quanto mi aspettassi sarebbe possibile):

ad esempio, usando:

rho<-0.75
p<-10
n<-25*p
Su<-matrix(rho,p-1,p-1)
diag(Su)<-1
su<-1
set.seed(123)
bet<-runif(p)

la media delle simulazioni R 2 su 1000 è . Il limite superiore teorico sopra dà . Il limite sembra essere ugualmente preciso su molti valori di R 2 . Davvero sorprendente!R20.9608190.9609081R2

EDIT2:

dopo ulteriori ricerche, sembra che la qualità dell'approssimazione del limite superiore a E ( R 2 ) migliorerà all'aumentare di λ + p (e tutto il resto uguale, λ aumenta con n ).E(R2)λ+pλn


R 2 ha una distribuzione Beta con parametri che dipendono solo da n e p . No ? R2np
Stéphane Laurent

1
Oooppss mi dispiace, la mia affermazione precedente è vera solo sotto l'ipotesi del "modello nullo" (solo intercettazione). Altrimenti la distribuzione di R 2 dovrebbe essere qualcosa di simile a una distribuzione Beta non centrale, con un parametro di non centralità che coinvolge i parametri sconosciuti. R2
Stéphane Laurent,

@StéphaneLaurent: thanks. Would you know more about the relationship between the unknown parameters and the parameters of the Beta? I'm stuck, so any pointer would be welcome...
user603

Do you absolutely need to deal with E[R2]E[R2] ? Perhaps there is a simple exact formula for E[R2/(1R2)]E[R2/(1R2)].
Stéphane Laurent

1
With the notations of my answer, R2/(1R2)=kFR2/(1R2)=kF for some scalar kk and the first moment of the noncentral FF-distribution is simple.
Stéphane Laurent

Risposte:


13

Any linear model can be written Y=μ+σGY=μ+σG where GG has the standard normal distribution on RnRn and μμ is assumed to belong to a linear subspace WW of RnRn. In your case W=Im(X)W=Im(X).

Let [1]W[1]W be the one-dimensional linear subspace generated by the vector (1,1,,1)(1,1,,1). Taking U=[1]U=[1] below, the R2R2 is highly related to the classical Fisher statistic F=PZY2/(m)PWY2/(nm),

F=PZY2/(m)PWY2/(nm),
for the hypothesis test of H0:{μU}H0:{μU} where UWUW is a linear subspace, and denoting by Z=UWZ=UW the orthogonal complement of UU in WW, and denoting m=dim(W)m=dim(W) and =dim(U)=dim(U) (then m=pm=p and =1=1 in your situation).

Indeed, PZY2PWY2=R21R2

PZY2PWY2=R21R2
because the definition of R2R2 is R2=PZY2PUY2=1PWY2PUY2.
R2=PZY2PUY2=1PWY2PUY2.

Obviously PZY=PZμ+σPZGPZY=PZμ+σPZG and PWY=σPWGPWY=σPWG.

When H0:{μU}H0:{μU} is true then PZμ=0PZμ=0 and therefore F=PZG2/(m)PWG2/(nm)Fm,nm

F=PZG2/(m)PWG2/(nm)Fm,nm
has the Fisher Fm,nmFm,nm distribution. Consequently, from the classical relation between the Fisher distribution and the Beta distribution, R2B(m,nm)R2B(m,nm).

In the general situation we have to deal with PZY=PZμ+σPZGPZY=PZμ+σPZG when PZμ0PZμ0. In this general case one has PZY2σ2χ2m(λ)PZY2σ2χ2m(λ), the noncentral χ2χ2 distribution with mm degrees of freedom and noncentrality parameter λ=PZμ2σ2λ=PZμ2σ2, and then FFm,nm(λ)FFm,nm(λ) (noncentral Fisher distribution). This is the classical result used to compute power of FF-tests.

The classical relation between the Fisher distribution and the Beta distribution hold in the noncentral situation too. Finally R2R2 has the noncentral beta distribution with "shape parameters" mm and nm and noncentrality parameter λ. I think the moments are available in the literature but they possibly are highly complicated.

Finally let us write down PZμ. Note that PZ=PWPU. One has PUμ=ˉμ1 when U=[1], and PWμ=μ. Hence PZμ=μˉμ1 where here μ=Xβ for the unknown parameters vector β.


1
PZx is the orthogoanl projection of x on the linear subspace Z. And P denotes projection on the orthogonal.
Stéphane Laurent

1
Beware of PxPx2. I'm going to edit my post to write the formulas.
Stéphane Laurent

1
Done - do you see any simplification ?
Stéphane Laurent

1
ˉμ=1nμi
Stéphane Laurent

1
Type I, obviously: type II are distributed on (0,). Actually R2/(1R2) has the type II distribution. I have done the last corrections for today.
Stéphane Laurent
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.