Nel caso della PCA, "varianza" significa varianza sommativa o variabilità multivariata o variabilità complessiva o variabilità totale . Di seguito è riportata la matrice di covarianza di circa 3 variabili. Le loro variazioni sono sulla diagonale e la somma dei 3 valori (3.448) è la variabilità complessiva.
1.343730519 -.160152268 .186470243
-.160152268 .619205620 -.126684273
.186470243 -.126684273 1.485549631
Ora, PCA sostituisce le variabili originali con nuove variabili, chiamate componenti principali, che sono ortogonali (cioè hanno zero covariazioni) e hanno varianze (chiamate autovalori) in ordine decrescente. Quindi, la matrice di covarianza tra i componenti principali estratti dai dati sopra è questa:
1.651354285 .000000000 .000000000
.000000000 1.220288343 .000000000
.000000000 .000000000 .576843142
Si noti che la somma diagonale è ancora 3.448, il che indica che tutte e 3 le componenti rappresentano tutta la variabilità multivariata. La prima componente principale rappresenta o "spiega" 1.651 / 3.448 = 47,9% della variabilità complessiva; il secondo spiega 1.220 / 3.448 = 35,4% di esso; il terzo spiega .577 / 3.448 = 16,7% di esso.
Quindi, cosa significano quando affermano che " PCA massimizza la varianza " o " PCA spiega la varianza massima "? Ovviamente non si trova la più grande varianza tra tre valori 1.343730519 .619205620 1.485549631
, no. PCA trova, nello spazio dati, la dimensione (direzione) con la maggiore varianza rispetto alla varianza complessiva1.343730519+.619205620+1.485549631 = 3.448
. Quella più grande varianza sarebbe 1.651354285
. Quindi trova la dimensione della seconda varianza più grande, ortogonale alla prima, al di fuori della 3.448-1.651354285
varianza complessiva rimanente . Quella seconda dimensione sarebbe 1.220288343
varianza. E così via. L'ultima dimensione rimanente è la .576843142
varianza. Vedi anche "Pt3" qui e un'ottima risposta qui spiegando come è stato fatto in modo più dettagliato.
Matematicamente, la PCA viene eseguita tramite funzioni di algebra lineare chiamate decomposizione degli automi o decomposizione svd. Queste funzioni ti restituiranno tutti gli autovalori 1.651354285 1.220288343 .576843142
(e gli autovettori corrispondenti) contemporaneamente ( vedi , vedi ).