Ad esempio, considera il ChickWeight
set di dati in R. La varianza ovviamente aumenta nel tempo, quindi se uso una semplice regressione lineare come:
m <- lm(weight ~ Time*Diet, data=ChickWeight)
Le mie domande:
- Quali aspetti del modello saranno discutibili?
- I problemi si limitano all'estrapolazione al di fuori
Time
dell'intervallo? - Quanto è tollerante la regressione lineare alla violazione di questo presupposto (ovvero, quanto deve essere eteroscedastica per causare problemi)?