Qual è una stima imparziale della R-square della popolazione?


14

Sono interessato a ottenere una stima imparziale di in una regressione lineare multipla.R2

Riflettendomi, posso pensare a due diversi valori che una stima imparziale di potrebbe tentare di far corrispondere.R2

  1. Fuori dal campione :R2 r-quadrato che si otterrebbe se l'equazione di regressione ottenuta dal campione ) sono stati applicati a una quantità infinita di dati esterni al campione ma dallo stesso processo di generazione dei dati.β^
  2. Popolazione :R2 il quadrato r che si otterrebbe se si ottenesse un campione infinito e il modello si adattasse a quel campione infinito (cioè ) o in alternativa solo il quadrato R implicito dal noto processo di generazione dei dati.β

Comprendo che l' R 2 regolatoR2 è progettato per compensare il sovradimensionamento osservato nel campione . Tuttavia, non è chiaro se l' R 2 corretto sia effettivamente una stima imparziale di R 2 , e se si tratta di una stima imparziale, quale delle due precedenti definizioni di R 2 mira a stimare.R2R2R2R2

Quindi, le mie domande:

  • Qual è una stima imparziale di ciò che chiamo sopra dal campione ?R2
  • Qual è una stima imparziale di ciò che chiamo sopra la popolazione ?R2
  • Ci sono riferimenti che forniscono simulazione o altra prova dell'imparzialità?

La domanda quale formula per agg. R ^ 2 è meno distorto, ad esempio qui .
ttnphns,

Grazie. Ora sto leggendo il riferimento che menzioni: Yin, P., & Fan, X. (2001). Stima del restringimento di nella regressione multipla: un confronto tra diversi metodi analitici. The Journal of Experimental Education, 69 (2), 203-224. R2
Jeromy Anglim,

Risposte:


14

Valutazione delle rettifiche analitiche su R-square

@ttnphns mi ha riferito all'articolo Yin e Fan (2001) che confronta diversi metodi analitici per la stima di . Secondo la mia domanda, discriminano due tipi di stimatori. Usano la seguente terminologia:R2

  • ρ2 : stima del coefficiente di correlazione multipla della popolazione quadrata
  • : stimatore del coefficiente di validità incrociata della popolazione quadrataρc2

I loro risultati sono riassunti in astratto:

R2ρ2ρ2ρc2 .

ρ2

R^2=1(N3)(1R2)(Np1)[1+2(1R2)Np2.3]

dove N è la dimensione del campione e p è il numero di predittori.

Stime empiriche di aggiustamenti al R-quadrato

R2ρ2ρc2ρ2 .

Riferimenti

  • Kromrey, JD, & Hines, CV (1995). Uso di stime empiriche di contrazione nella regressione multipla: un avvertimento. Misura educativa e psicologica, 55 (6), 901-925.
  • R2
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.