Perché è necessario porre l'assunto distributivo sugli errori, ad es
ϵ i ∼ N ( 0 , σ 2 ) , con .
Perché non scrivere
y i ~ N ( X β , σ 2 ) , con ,
dove in entrambi i casi . Ho visto sottolineato che le ipotesi distributive sono poste sugli errori, non sui dati, ma senza spiegazioni.
Non capisco davvero la differenza tra queste due formulazioni. In alcuni punti in cui vedo le ipotesi distributive posizionate sui dati (Bayesian acceso. Sembra principalmente), ma la maggior parte delle volte le ipotesi sono poste sugli errori.
Quando si modella, perché / si dovrebbe scegliere di iniziare con ipotesi sull'uno o sull'altro?