Questo post fa riferimento a un modello di regressione lineare bivariata, . Ho sempre preso il partizionamento della somma totale dei quadrati (SSTO) in somma dei quadrati per errore (SSE) e somma dei quadrati per il modello (SSR) sulla fede, ma una volta che ho iniziato davvero a pensarci, non capisco perché funziona ...
La parte che non capisco:
: un valore osservato di y
yi : La media di tutti osservati s
: il valore adattato / previsto di y per una data osservazione x
: residuo / errore (se quadrato e sommato per tutte le osservazioni si tratta di SSE)
: quanto il valore adattato del modello differisce dalla media (se al quadrato e sommato per tutte le osservazioni si tratta di SSR)
: quanto un valore osservato differisce dalla media (se sommato e sommato per tutte le osservazioni, questo è SSTO).
Posso capire perché, per una singola osservazione, senza quadrare nulla, . E capisco perché, se vuoi sommare le cose su tutte le osservazioni, devi quadrarle o faranno aggiungere fino a 0.
La parte che non capisco è perché (es. SSTO = SSR + SSE). Sembra che se hai una situazione in cui , quindi , non . Perché non è questo il caso qui? A = B + C A 2 = B 2 + 2 B C + C 2 A 2 = B 2 + C 2