Qual è la formula esatta usata in R lm()
per il rettangolo R rettificato? Come posso interpretarlo?
Formule rettangolari rettificate
Sembra che esistano diverse formule per calcolare il rettangolo R rettificato.
- Formula di Wherry:
- Formula di McNemar:
- Formula del Signore:
- Formula di Stein:
Descrizioni del libro di testo
- Secondo il libro di testo di Field, Discovering Statistics Using R (2012, p. 273) R usa l'equazione di Wherry che "ci dice quanta varianza in Y verrebbe calcolata se il modello fosse stato derivato dalla popolazione da cui è stato prelevato il campione". Non dà la formula per Wherry. Raccomanda di usare la formula di Stein (a mano) per verificare se il modello convalida in modo incrociato.
- Kleiber / Zeileis, Applied Econometrics with R (2008, p. 59) dichiarano che è "R-quadrato rettificato di Theil" e non dicono esattamente come la sua interpretazione vari dal R-quadrato multiplo.
- Dalgaard, Introductory Statistics with R (2008, p. 113) scrive che "se moltiplichi [rettangolo R rettificato] per il 100%, può essere interpretato come '% di riduzione della varianza'". Non dice a quale formula corrisponde.
In precedenza avevo pensato e letto ampiamente che R-squared penalizza per l'aggiunta di ulteriori variabili al modello. Ora l'uso di queste diverse formule sembra richiedere interpretazioni diverse. Ho anche esaminato una domanda correlata su Stack Overflow ( Qual è la differenza tra R-quadrato multiplo e R-quadrato rettificato in una regressione dei minimi quadrati a singola variabile? ), E il dizionario statistico della scuola di Wharton su UPenn .
Domande
- Quale formula viene utilizzata per il rettangolo r rettificato di R
lm()
? - Come posso interpretarlo?
ans$adj.r.squared <- 1 - (1 - ans$r.squared) * ((n - df.int)/rdf)
:, dove ans $ r.squared = R ^ 2; n = n, rdf = residuo df, df.int = intercetta df (0 o 1).