Sto cercando di comprendere l'output dell'analisi dei componenti principali eseguita come segue:
> head(iris)
Sepal.Length Sepal.Width Petal.Length Petal.Width Species
1 5.1 3.5 1.4 0.2 setosa
2 4.9 3.0 1.4 0.2 setosa
3 4.7 3.2 1.3 0.2 setosa
4 4.6 3.1 1.5 0.2 setosa
5 5.0 3.6 1.4 0.2 setosa
6 5.4 3.9 1.7 0.4 setosa
> res = prcomp(iris[1:4], scale=T)
> res
Standard deviations:
[1] 1.7083611 0.9560494 0.3830886 0.1439265
Rotation:
PC1 PC2 PC3 PC4
Sepal.Length 0.5210659 -0.37741762 0.7195664 0.2612863
Sepal.Width -0.2693474 -0.92329566 -0.2443818 -0.1235096
Petal.Length 0.5804131 -0.02449161 -0.1421264 -0.8014492
Petal.Width 0.5648565 -0.06694199 -0.6342727 0.5235971
>
> summary(res)
Importance of components:
PC1 PC2 PC3 PC4
Standard deviation 1.7084 0.9560 0.38309 0.14393
Proportion of Variance 0.7296 0.2285 0.03669 0.00518
Cumulative Proportion 0.7296 0.9581 0.99482 1.00000
>
Tendo a concludere quanto segue dall'output sopra:
La percentuale di varianza indica la quantità di varianza totale presente nella varianza di un particolare componente principale. Pertanto, la variabilità del PC1 spiega il 73% della varianza totale dei dati.
I valori di rotazione mostrati sono gli stessi dei "caricamenti" menzionati in alcune descrizioni.
Considerando le rotazioni di PC1, si può concludere che Sepal.Length, Petal.Length e Petal.Width sono direttamente correlati e tutti sono inversamente correlati a Sepal.Width (che ha un valore negativo nella rotazione di PC1)
Ci può essere un fattore nelle piante (qualche sistema funzionale chimico / fisico ecc.) Che può influenzare tutte queste variabili (Sepal.Length, Petal.Length e Petal.Width in una direzione e Sepal.Width nella direzione opposta).
Se voglio mostrare tutte le rotazioni in un grafico, posso mostrare il loro contributo relativo alla variazione totale moltiplicando ciascuna rotazione per proporzione della varianza di quel componente principale. Ad esempio, per PC1, le rotazioni di 0,52, -0,26, 0,58 e 0,56 sono tutte moltiplicate per 0,73 (varianza proporzionale per PC1, mostrata nell'output di riepilogo (res).
Ho ragione sulle conclusioni sopra?
Modifica per quanto riguarda la domanda 5: Voglio mostrare tutta la rotazione in un semplice diagramma a barre come segue:
Dato che PC2, PC3 e PC4 hanno un contributo progressivamente inferiore alla variazione, avrà senso regolare (ridurre) i caricamenti delle variabili lì?