Sono interessato al significato geometrico della correlazione multipla e del coefficiente di determinazione nella regressione o in notazione vettoriale,
Qui la matrice di progettazione ha righe e colonne, di cui la prima è , un vettore di 1 che corrisponde all'intercetta .
La geometria è più interessante nello spazio soggetto dimensionale piuttosto che nello spazio variabile dimensionale. Definisci la matrice del cappello:
Questa è una proiezione ortogonale sullo spazio della colonna di , ovvero il piano attraverso l'origine attraversato dai vettori che rappresentano ciascuna variabile , il primo dei quali è . Quindi proietta il vettore delle risposte osservate sulla sua "ombra" sul piano, il vettore dei valori adattati , e se noi guardando lungo il percorso della proiezione vediamo il vettore dei residui costituisce il terzo lato di un triangolo. Questo dovrebbe fornirci due percorsi per un'interpretazione geometrica di :
- Il quadrato del coefficiente di correlazione multipla, , che è definito come la correlazione tra e . Questo apparirà geometricamente come il coseno di un angolo.
- In termini di lunghezze dei vettori: ad esempio .
Sarei felice di vedere un breve resoconto che spiega:
- I dettagli più fini per (1) e (2),
- Perché (1) e (2) sono equivalenti,
- In breve, come l'intuizione geometrica ci consente di visualizzare le proprietà di base di , ad esempio perché va a 1 quando la varianza del rumore va a 0. (Dopotutto, se non riusciamo a intuire dalla nostra visualizzazione, non è altro che un bella immagine.)
Apprezzo che sia più semplice se le variabili sono centrate per prime, il che rimuove l'intercettazione dalla domanda. Tuttavia, nella maggior parte degli account di libri di testo che introducono una regressione multipla, la matrice di progettazione è come ho indicato. Ovviamente va bene se un'esposizione scava nello spazio attraversato dalle variabili centrate, ma per approfondire l'algebra lineare del libro di testo, sarebbe molto utile ricollegarlo a ciò che sta accadendo geometricamente nella situazione non centrata. Una risposta davvero perspicace potrebbe spiegare che cosa sta esattamente analizzando geometricamente quando il termine dell'intercettazione viene eliminato , ovvero quando il vettore1 nviene rimosso dal set di spanning. Non credo che questo ultimo punto possa essere affrontato considerando solo le variabili centrate.