Sono interessato a ottenere una stima imparziale di in una regressione lineare multipla.
Riflettendomi, posso pensare a due diversi valori che una stima imparziale di potrebbe tentare di far corrispondere.
- Fuori dal campione : r-quadrato che si otterrebbe se l'equazione di regressione ottenuta dal campione ) sono stati applicati a una quantità infinita di dati esterni al campione ma dallo stesso processo di generazione dei dati.
- Popolazione : il quadrato r che si otterrebbe se si ottenesse un campione infinito e il modello si adattasse a quel campione infinito (cioè ) o in alternativa solo il quadrato R implicito dal noto processo di generazione dei dati.
Comprendo che l' R 2 regolato è progettato per compensare il sovradimensionamento osservato nel campione . Tuttavia, non è chiaro se l' R 2 corretto sia effettivamente una stima imparziale di R 2 , e se si tratta di una stima imparziale, quale delle due precedenti definizioni di R 2 mira a stimare.
Quindi, le mie domande:
- Qual è una stima imparziale di ciò che chiamo sopra dal campione ?
- Qual è una stima imparziale di ciò che chiamo sopra la popolazione ?
- Ci sono riferimenti che forniscono simulazione o altra prova dell'imparzialità?