Nel caso della PCA, "varianza" significa varianza sommativa o variabilità multivariata o variabilità complessiva o variabilità totale . Di seguito è riportata la matrice di covarianza di circa 3 variabili. Le loro variazioni sono sulla diagonale e la somma dei 3 valori (3.448) è la variabilità complessiva.
1.343730519 -.160152268 .186470243
-.160152268 .619205620 -.126684273
.186470243 -.126684273 1.485549631
Ora, PCA sostituisce le variabili originali con nuove variabili, chiamate componenti principali, che sono ortogonali (cioè hanno zero covariazioni) e hanno varianze (chiamate autovalori) in ordine decrescente. Quindi, la matrice di covarianza tra i componenti principali estratti dai dati sopra è questa:
1.651354285 .000000000 .000000000
.000000000 1.220288343 .000000000
.000000000 .000000000 .576843142
Si noti che la somma diagonale è ancora 3.448, il che indica che tutte e 3 le componenti rappresentano tutta la variabilità multivariata. La prima componente principale rappresenta o "spiega" 1.651 / 3.448 = 47,9% della variabilità complessiva; il secondo spiega 1.220 / 3.448 = 35,4% di esso; il terzo spiega .577 / 3.448 = 16,7% di esso.
Quindi, cosa significano quando affermano che " PCA massimizza la varianza " o " PCA spiega la varianza massima "? Ovviamente non si trova la più grande varianza tra tre valori 1.343730519 .619205620 1.485549631, no. PCA trova, nello spazio dati, la dimensione (direzione) con la maggiore varianza rispetto alla varianza complessiva1.343730519+.619205620+1.485549631 = 3.448 . Quella più grande varianza sarebbe 1.651354285. Quindi trova la dimensione della seconda varianza più grande, ortogonale alla prima, al di fuori della 3.448-1.651354285varianza complessiva rimanente . Quella seconda dimensione sarebbe 1.220288343varianza. E così via. L'ultima dimensione rimanente è la .576843142varianza. Vedi anche "Pt3" qui e un'ottima risposta qui spiegando come è stato fatto in modo più dettagliato.
Matematicamente, la PCA viene eseguita tramite funzioni di algebra lineare chiamate decomposizione degli automi o decomposizione svd. Queste funzioni ti restituiranno tutti gli autovalori 1.651354285 1.220288343 .576843142(e gli autovettori corrispondenti) contemporaneamente ( vedi , vedi ).