Una spiegazione geometrico-statistica.
Immagina di creare un grafico a dispersione "dentro-fuori" in cui soggetti sono gli assi e le variabili e sono i punti . Questo è chiamato un diagramma di spazio soggetto (al contrario del solito diagramma di spazio variabile ). Poiché ci sono solo 2 punti da tracciare, tutte le dimensioni in un tale spazio, tranne solo due dimensioni arbitrarie che sono in grado di supportare i 2 punti più l'origine, sono ridondanti e possono essere eliminate in modo sicuro. E così ci resta un aereo. Disegniamo frecce vettoriali dall'origine ai punti: queste sono le nostre variabili e come vettori nello spazio soggetto dei dati.n 2 XYXY
Ora, se le variabili fossero centrate , allora, in uno spazio soggetto, il coseno dell'angolo tra i loro vettori è il loro coefficiente di correlazione . Nell'immagine sotto i vettori e sono ortogonali: il loro . La non correlazione era un prerequisito delineato da @Dilip nella loro risposta.Y r = 0XYr=0
Anche per le variabili centrate, le loro lunghezze vettoriali in uno spazio soggetto sono le loro deviazioni standard . Nella foto, e hanno la stessa lunghezza, - anche le variazioni uguali erano un prerequisito fatto da @Dilip.YXY
Per disegnare la variabile o la variabile usiamo solo l'aggiunta o la sottrazione vettoriale che abbiamo dimenticato dalla scuola (sposta il vettore Y alla fine del vettore X e inverti la direzione in caso di sottrazione, questo è indicato da frecce grigie sulla foto, quindi disegna un vettore nel punto in cui punta la freccia grigia).X + YX−YX+Y
Diventa molto chiaro che la lunghezza dei vettori o (la deviazione standard di queste variabili) è, per teorema di Pitagora, e l'angolo tra e o è 45 gradi, che coseno - la correlazione - èX + Y √X−YX+Y XX-YX+Y0.707 ...2σ2−−−√XX−YX+Y0.707...