La popolazione r-square può essere definita assumendo punteggi fissi o punteggi casuali:
Punteggi fissi: le dimensioni del campione e i valori particolari dei predittori vengono mantenuti fissi. Pertanto, è la percentuale di varianza spiegata nel risultato dall'equazione di regressione della popolazione quando i valori del predittore sono mantenuti costanti.
Punteggi casuali: i valori particolari dei predittori vengono estratti da una distribuzione. Pertanto, riferisce alla percentuale di varianza spiegata nel risultato nella popolazione in cui i valori del predittore corrispondono alla distribuzione della popolazione dei predittori.
In precedenza ho chiesto se questa distinzione fa molta differenza rispetto alle stime di . Ho anche chiesto in generale come calcolare una stima imparziale di .
Vedo che, man mano che la dimensione del campione aumenta, la distinzione tra punteggio fisso e punteggio casuale diventa meno importante. Tuttavia, sto cercando di confermare se R ^ 2 corretto è progettato per stimare il punteggio fisso o il punteggio casuale .
Domande
- Viene regolata progettato per stimare il punteggio fisso o casuale punteggio ?
- Esiste una spiegazione di principio di come la formula per il rettangolo r rettificato si riferisce a una o l'altra forma di ?
Contesto della mia confusione
Quando leggo Yin e Fan (2001, p.206) scrivono:
Uno dei presupposti di base del modello di regressione multipla è che i valori delle variabili indipendenti sono costanti note e sono fissati dal ricercatore prima dell'esperimento. Solo la variabile dipendente è libera di variare da campione a campione. Quel modello di regressione è chiamato modello di regressione lineare fisso .
Tuttavia, nelle scienze sociali e comportamentali, i valori delle variabili indipendenti sono raramente fissati dai ricercatori e sono anche soggetti a errori casuali. Pertanto, è stato suggerito un secondo modello di regressione per le applicazioni, in cui le variabili dipendenti e indipendenti possono variare (Binder, 1959; Park & Dudycha, 1974). Tale modello è chiamato modello casuale (o modello di correzione). Sebbene le stime di massima verosimiglianza dei coefficienti di regressione ottenuti dai modelli casuali e fissi siano le stesse in base alle ipotesi di normalità, le loro distribuzioni sono molto diverse. Il modello casuale è così complesso che sono necessarie ulteriori ricerche prima di poter essere accettato al posto del modello di regressione lineare fisso comunemente usato. Pertanto, viene solitamente applicato il modello fisso, anche quando le ipotesi non sono state completamente soddisfatte (Claudy, 1978). Tali applicazioni del modello di regressione fissa con ipotesi violate provocherebbero un "eccesso di adattamento", poiché l'errore casuale introdotto dai dati di esempio non perfetti tende ad essere capitalizzato nel processo. Di conseguenza, il coefficiente di correlazione multipla del campione ottenuto in questo modo tende a sovrastimare la correlazione multipla della popolazione reale (Claudy, 1978; Cohen & Cohen, 1983; Cummings, 1982).
Quindi non ero chiaro se l'affermazione di cui sopra sta dicendo che l' rettificato compensa l'errore introdotto dal modello casuale o se questo era solo un avvertimento nel documento che segnala l'esistenza del modello casuale, ma che il documento stava per concentrarsi sul modello fisso.
Riferimenti
- Yin, P., & Fan, X. (2001). Stima del restringimento di nella regressione multipla: un confronto tra diversi metodi analitici. The Journal of Experimental Education, 69 (2), 203-224. PDF