Nei commenti, sono stati suggeriti 15 modi per comprendere il coefficiente di correlazione:
I 13 modi discussi nell'articolo di Rodgers e Nicewander (The American Statistician, febbraio 1988) sono
Una funzione di punteggi e mezzi grezzi,
r=∑(Xi−X¯)(Yi−Y¯)∑(Xi−X¯)2(Yi−Y¯)2−−−−−−−−−−−−−−−−−−√.
Covarianza standardizzata,
r=sXY/(sXsY)
dove è la covarianza del campione e s X e s Y sono le deviazioni standard del campione.sXYsXsY
Pendenza standardizzata della linea di regressione,
r=bY⋅XsXsY=bX⋅YsYsX,
dove e b X ⋅ Y sono le pendenze delle linee di regressione.bY⋅XbX⋅Y
La media geometrica dei due pendii di regressione,
r=±bY⋅XbX⋅Y−−−−−−−√.
La radice quadrata del rapporto di due varianze (proporzione della variabilità contabilizzata),
r=∑(Yi−Yi^)2∑(Yi−Y¯)2−−−−−−−−−−−−⎷=SSREGSSTOT−−−−−−√=sY^sY.
Il prodotto incrociato medio di variabili standardizzate,
r=∑zXzY/N.
Una funzione dell'angolo tra le due linee di regressione standardizzate. Le due linee di regressione (di vs. X e X vs. Y ) sono simmetriche rispetto alla diagonale. Lascia che l'angolo tra le due linee sia β . PoiYXXYβ
r=sec(β)±tan(β).
Una funzione dell'angolo tra i due vettori variabili,
r=cos(α).
Una varianza ridotta della differenza tra i punteggi standardizzati. Lasciando che sia la differenza tra le variabili X e Y standardizzate per ogni osservazione,zY−zXXY
r=1−s2(zY−zX)/2=s2(zY+zX)/2−1.
Stimato dalla regola del "pallone",
r≈1−(h/H)2−−−−−−−−−√
dove è l'intervallo verticale dell'intero diagramma a dispersione X - Y e h è l'intervallo attraverso il "centro della distribuzione sull'asse X " (ovvero attraverso il punto dei mezzi).HX−YhX
In relazione alle ellissi bivariate di isoconcentrazione,
r=D2−d2D2+d2
dove e d sono rispettivamente le lunghezze maggiore e minore dell'asse. r eguaglia anche la pendenza della linea tangente di un isocontour (in coordinate standardizzate) nel punto in cui il contorno attraversa l'asse verticale.Ddr
Una funzione delle statistiche di test da esperimenti progettati,
r=tt2+n−2−−−−−−−−√
dove è la statistica del test in un test t indipendente da due campioni per un esperimento progettato con due condizioni di trattamento (codificato come X = 0 , 1 ) e n è il numero totale combinato di osservazioni nei due gruppi di trattamento.ttX=0,1n
Il rapporto di due mezzi. Assumi la normalità bivariata e standardizza le variabili. Selezionare alcuni arbitrariamente grande valore di X . PoiXcX
r=E(Y|X>Xc)E(X|X>Xc).