Come ottenere il valore dell'errore al quadrato medio in una regressione lineare in R


20

Consenti a un modello di regressione lineare ottenuto dalla funzione R che vorrei sapere se è possibile ottenere con il comando Errore quadrato medio.

Ho avuto l'uscita SEGUENTE di un esempio

> lm <- lm(MuscleMAss~Age,data)
> sm<-summary(lm)
> sm

Call:
lm(formula = MuscleMAss ~ Age, data = data)

Residuals:
     Min       1Q   Median       3Q      Max 
-16.1368  -6.1968  -0.5969   6.7607  23.4731 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept) 156.3466     5.5123   28.36   <2e-16 ***
Age          -1.1900     0.0902  -13.19   <2e-16 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1

Residual standard error: 8.173 on 58 degrees of freedom
Multiple R-squared:  0.7501,    Adjusted R-squared:  0.7458 
F-statistic: 174.1 on 1 and 58 DF,  p-value: < 2.2e-16

L'R-quadrato multiplo è l'errore del quadrato di somma? se la risposta è no, si potrebbe spiegare il significato di R-quadrato multiplo e R-quadrato multiplo

Risposte:


25

Il R-quadrato multiplo che R indica è il coefficiente di determinazione , che è dato dalla formula

R2=1-SSresSSbimbo.

La somma degli errori al quadrato è data (grazie a una risposta precedente ) da sum(sm$residuals^2).

L'errore quadratico medio è dato da mean(sm$residuals^2). È possibile scrivere una funzione per calcolare questo, ad esempio:

mse <- function(sm) 
    mean(sm$residuals^2)

5
+1. Un'altra soluzione, basata solo su ciò che è visibile nell'output , è sm$sigma^2 * sm$fstatistic[3]/(1+sum(sm$fstatistic[2:3])). Cioè, dalla riga antepenultimate leggi e df e nell'ultima riga conta il numero di parametri ( ), dando . 58 1 + 1 8.173 2 × 58 / ( 1 + 1 + 58 ) = 64.578,173581+18,1732×58/(1+1+58)=64.57
whuber

6
Antepenultimate è una grande parola.
FBT

1
Come al solito, un modo molto più semplice è scriveremse <- function(sm) mean(sm$residuals^2)
Marius Hofert il

4
> Non significa che l'errore al quadrato è dato dai residui ^ 2 / errore df dalla tabella ANOVA invece che dalla media (residui ^ 2). Quest'ultimo è il quadrato dell'errore di predizione medio. Non sono sicuro che mi manchi qualche comprensione. Spiacenti, non ho abbastanza punti reputazione per pubblicare un commento.
SrikanthRaja,

1
Ma sono d'accordo su ciò che ha detto user45409. Secondo quanto appreso, MSE = residui ^ 2 / errore df.
vtshen
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.