Considera il modello lineare semplice:
yy = X ′ ββ + ϵ
dove ϵ i ∼ i . io . d .N ( 0 , σ 2 )
La mia domanda è, dato E ( X ′ X )
* Ho ipotizzato, scrivendo questo, che ottenere stesso non sarebbe possibile.E ( R 2 )
EDIT1
usando la soluzione derivata da Stéphane Laurent (vedi sotto) possiamo ottenere un limite superiore non banale su . Alcune simulazioni numeriche (sotto) mostrano che questo limite è in realtà piuttosto stretto.E ( R 2 )
Stéphane Laurent ha derivato quanto segue:
dove è una distribuzione beta non centrale con parametro di non centralità conR 2 ∼ B ( p - 1 , n - p , λ ) B ( p - 1 , n - p , λ ) λ
λ = | | X ′ β - E ( X ) ′ β 1 n | | 2σ 2
Così
E ( R 2 ) = E ( χ 2 p - 1 ( λ )χ 2 p - 1 ( λ ) + χ 2 n - p )≥E(χ 2 p - 1 (λ))E ( χ 2 p - 1 ( λ ) ) + E ( χ 2 n - p )
dove χ 2 k ( λ ) è un non-centrale χ 2 con parametro λ e k gradi di libertà. Quindi un limite superiore non banale per E ( R 2 ) è
λ + p - 1λ + n - 1
è molto stretto (molto più stretto di quanto mi aspettassi sarebbe possibile):
ad esempio, usando:
rho<-0.75
p<-10
n<-25*p
Su<-matrix(rho,p-1,p-1)
diag(Su)<-1
su<-1
set.seed(123)
bet<-runif(p)
la media delle simulazioni R 2 su 1000 è . Il limite superiore teorico sopra dà . Il limite sembra essere ugualmente preciso su molti valori di R 2 . Davvero sorprendente!0.960819
0.9609081
EDIT2:
dopo ulteriori ricerche, sembra che la qualità dell'approssimazione del limite superiore a E ( R 2 ) migliorerà all'aumentare di λ + p (e tutto il resto uguale, λ aumenta con n ).