Frequento un corso di analisi dei dati e alcune delle mie idee ben radicate vengono scosse. Vale a dire, l'idea che l'errore (epsilon), così come qualsiasi altro tipo di varianza, si applica solo (così ho pensato) a un gruppo (un campione o l'intera popolazione). Ora, ci viene insegnato che una delle ipotesi di regressione è che la varianza è "la stessa per tutti gli individui". Questo è in qualche modo scioccante per me. Ho sempre pensato che fosse la varianza in Y attraverso tutti i valori di X che si riteneva costante.
Ho fatto una chiacchierata con il prof, che mi ha detto che quando facciamo una regressione, assumiamo che il nostro modello sia vero. E penso che sia la parte difficile. Per me, il termine errore (epsilon) significava sempre qualcosa come "qualunque elemento non conosciamo e che possa influenzare la nostra variabile di risultato, oltre ad un errore di misurazione". Nel modo in cui la lezione viene insegnata, non esiste "altra roba"; si presume che il nostro modello sia vero e completo. Ciò significa che tutta la variazione residua deve essere considerata come un prodotto dell'errore di misurazione (quindi, la misurazione di un individuo 20 volte dovrebbe produrre la stessa varianza della misurazione di 20 individui una volta).
Sento che qualcosa non va da qualche parte, mi piacerebbe avere un parere di esperti su questo ... C'è qualche spazio per l'interpretazione su quale sia il termine di errore, concettualmente parlando?