La situazione
Ho un set di dati con una dipendente e una variabile indipendente . Voglio adattare una regressione lineare a tratti continua con breakpoint noti / fissi che si verificano in . I breakpoin sono noti senza incertezza, quindi non voglio stimarli. Quindi inserisco una regressione (OLS) del modulo Ecco un esempio ink ( a 1 , a 2 , … , a k ) y i = β 0 + β 1 x i + β 2 max ( x i - a 1 , 0 ) + β 3 max ( x i - a 2 , 0 ) + … + Β k + 1 max ( x i
R
set.seed(123)
x <- c(1:10, 13:22)
y <- numeric(20)
y[1:10] <- 20:11 + rnorm(10, 0, 1.5)
y[11:20] <- seq(11, 15, len=10) + rnorm(10, 0, 2)
Supponiamo che il punto di interruzione si presenti a : 9.6
mod <- lm(y~x+I(pmax(x-9.6, 0)))
summary(mod)
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 21.7057 1.1726 18.511 1.06e-12 ***
x -1.1003 0.1788 -6.155 1.06e-05 ***
I(pmax(x - 9.6, 0)) 1.3760 0.2688 5.120 8.54e-05 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
L'intercetta e la pendenza dei due segmenti sono: e per il primo e e per il secondo, rispettivamente.- 1,1 8,5 0,27
Domande
- Come calcolare facilmente l'intercettazione e la pendenza di ciascun segmento? Il modello può essere riparemetrato per fare questo in un calcolo?
- Come calcolare l'errore standard di ogni pendenza di ciascun segmento?
- Come verificare se due pendenze adiacenti hanno le stesse pendenze (ovvero se il punto di interruzione può essere omesso)?
x
eI(pmax(x-9.6,0))
, è corretto?