Spiegazione di un diagramma di caricamento di PCA o analisi fattoriale.
Il diagramma di caricamento mostra le variabili come punti nello spazio dei principali componenti (o fattori). Le coordinate delle variabili sono, di solito, i caricamenti. (Se si combina correttamente il diagramma di caricamento con il corrispondente diagramma a dispersione dei casi di dati nello stesso spazio dei componenti, sarebbe biplot.)
Diamo 3 variabili in qualche modo correlati, , W , U . Noi centriamo loro e ad effettuare PCA , l'estrazione di 2 primi componenti principali su tre: F 1 e F 2 . Usiamo i caricamenti come coordinate per eseguire il diagramma di caricamento di seguito. I caricamenti sono gli elementi degli autovettori non standardizzati, vale a dire gli autovettori dotati delle corrispondenti varianze dei componenti o autovalori.VWUF1F2
La trama di caricamento è l'aereo sull'immagine. Consideriamo unica variabile . La freccia abitualmente disegnata su un diagramma di caricamento è ciò che è etichettato h ′ qui; le coordinate a 1 , a 2 sono rispettivamente i caricamenti di V con F 1 e F 2 (si noti che terminologicamente è più corretto dire "componente carica una variabile", non viceversa).Vh'un'1un'2VF1F2
Freccia è la proiezione sul piano componente, di vettore h che è la vera posizione della variabile V nelle variabili spazio attraversato da V , W , U . La lunghezza quadrata del vettore, h 2 , è la varianza una di V . Mentre h ′ 2 è la porzione di quella varianza spiegata dai due componenti.h′hVVWUh2aVh′2
Caricamento, correlazione, correlazione proiettata . Poiché le variabili erano centrate prima dell'estrazione dei componenti, è la correlazione di Pearson tra V e il componente F 1 . Ciò non deve essere confuso con cos α sul grafico di caricamento, che è un'altra quantità: è la correlazione di Pearson tra il componente F 1 e la variabile vettoriale qui come h ' . Come variabile, h ' è la previsione di V dai componenti (normalizzata) a regressione lineare (confrontare con il disegno della geometria regressione lineare quicosϕVF1cosαF1h′h′V) dove i carichi 's sono i coefficienti di regressione (quando i componenti sono mantenuti ortogonali, come estratti).a
Ulteriore. Possiamo ricordare (trigonometria) che . Può essere inteso come il prodotto scalare tra il vettore V e il vettore di lunghezza unitaria F 1 : h ⋅ 1 ⋅ cos ϕ . F 1 imposta quel vettore varianza unità perché non ha una propria varianza a parte quella varianza di V che spiega (per quantità h ′ ): cioè F 1a1=h⋅cosϕVF1h⋅1⋅cosϕF1Vh′F1è un'entità estratta da V, W, U e non un'entità invitata dall'esterno. Quindi, chiaramente, è lacovarianzatraVestandardizzata, in scala unitariab(per impostares1= √a1=varV⋅varF1−−−−−−−−−−√⋅r=h⋅1⋅cosϕVb) componenteF1. Questa covarianza è direttamente paragonabile alle covarianze tra le variabili di input; per esempio, la covarianza traVeWsarà il prodotto delle loro lunghezze vettoriali moltiplicato per il coseno tra di loro.s1=varF1−−−−−√=1F1VW
Per riassumere: caricare può essere visto come la covarianza tra il componente standardizzato e la variabile osservata, h ⋅ 1 ⋅ cos ϕ , o equivalentemente tra il componente standardizzato e l'immagine spiegata (da tutti i componenti che definiscono la trama) dell'immagine variabile, h ′ ⋅ 1 ⋅ cos α . Quel cos α potrebbe essere chiamato correlazione V-F1 proiettata sul sottospazio del componente F1-F2.a1h⋅1⋅cosϕh′⋅1⋅cosαcosα
La suddetta correlazione tra una variabile e un componente, , è anche chiamata caricamento standardizzato o riscalato . È conveniente nell'interpretazione dei componenti perché è nell'intervallo [-1,1].cosϕ=a1/h
Relazione con autovettori . Il caricamento ridimensionato non deve essere confuso con l' elemento autovettore che - come lo conosciamo - è il coseno dell'angolo tra una variabile e un componente principale. Ricordiamo che il caricamento è un elemento autovettore ridimensionato in base al valore singolare del componente (radice quadrata dell'autovalore). Vale a dire per la variabile V del nostro diagramma: a 1 = e 1 s 1 , dove s 1 è la st. deviazione (non 1 ma originale, ovvero il valore singolare) di F 1cosϕVa1=e1s1s11F1variabile latente. Quindi arriva quell'elemento autovettore , non ilcosϕstesso. La confusione attorno a due parole "coseno" si dissolve quando ricordiamo in che tipo di rappresentazione spaziale ci troviamo. Il valore di autovettoreècosenodell'angolo di rotazionedi una variabile come asse in pr. componente come asse nello spazio variabile (aka vista scatterplot),come qui. Mentrecosϕsul nostro diagramma di caricamentoè la misura della somiglianza del cosenotra una variabile come vettore e un pr. componente come ... beh .. anche come vettore, se ti piace (anche se è disegnato come asse sulla trama), - poiché siamo attualmente nellospazio soggettoe1=a1s1=hs1cosϕcosϕcosϕ (quale diagramma di caricamento è) dove le variabili correlate sono fan dei vettori - non sono assi ortogonali, - e gli angoli del vettore sono la misura dell'associazione - e non della rotazione della base spaziale.
Considerando che il carico è la misura di associazione angolare (cioè tipo di prodotto scalare) tra una variabile e un componente in scala unitaria, e il carico riscalato è il carico standardizzato in cui la scala della variabile è ridotta all'unità, ma il coefficiente di autovettore è il carico in cui il il componente è "sovra-standardizzato", ovvero è stato portato in scala (anziché 1); in alternativa, può essere pensato come un caricamento riscalato in cui la scala della variabile è stata portata in h / s (invece di 1).1/sh/s
Quindi, quali sono le associazioni tra una variabile e un componente? Puoi scegliere quello che ti piace. Può essere il caricamento (covarianza con componente in scala unitaria) ; il caricamento riscalato cos ϕ (= correlazione variabile-componente); correlazione tra l'immagine (previsione) e il componente (= correlazione proiettata cos α ). Puoi anche scegliere il coefficiente di autovettore e = a / s se ne hai bisogno (anche se mi chiedo quale potrebbe essere una ragione). O inventa la tua misura.a cosϕcosαe=a/s
Il valore di autovettore al quadrato ha il significato del contributo di una variabile in un pr. componente. Il caricamento quadrato al quadrato ha il significato del contributo di un pr. componente in una variabile.
Relazione con PCA basata su correlazioni. Se analizzassimo la PCA non solo centrando ma standardizzando (centrando poi la scala di unità varianza), allora i tre vettori di variabili (non le loro proiezioni sul piano) sarebbero della stessa lunghezza unitaria. Quindi segue automaticamente che un caricamento è correlazione , non covarianza, tra una variabile e un componente. Ma che la correlazione non sarà uguale a "carico standardizzato" della foto sopra (sulla base dell'analisi di variabili solo centrate), a causa di variabili PCA standardizzati (correlazioni a base di PCA) rese diverse componenti di PCA di variabili centrate ( PCA basato sulle covarianze). In PCA basato sulla correlazione a 1cosϕ perché h = 1 , ma i componenti principalinonsonogli stessicomponenti principali che otteniamo dal PCA basato su covarianze (leggi,leggi).a1=cosϕh=1
Nell'analisi fattoriale , il caricamento della trama ha fondamentalmente lo stesso concetto e la stessa interpretazione di PCA. L'unica (ma importante ) differenza è la sostanza di . Nell'analisi fattoriale, h ' - chiamata allora "comunanza" della variabile - è la porzione della sua varianza che è spiegata da fattori comuni che sono responsabili in particolare delle correlazioni tra le variabili. Mentre in PCA la parte spiegata h ′h′h′ h′è una "miscela" grossolana - in parte rappresenta correlazione e in parte non correlazione tra variabili. Con l'analisi dei fattori, il piano dei carichi sulla nostra immagine verrebbe orientato in modo diverso (in realtà, si estenderebbe addirittura dallo spazio delle nostre variabili 3d nella 4a dimensione, che non possiamo disegnare; il piano dei carichi non sarà un sottospazio del nostro Spazio 3d attraversato da e le altre due variabili) e la proiezione h ′ avrà un'altra lunghezza e con un altro angolo α . (La differenza teorica tra PCA e analisi dei fattori è spiegata geometricamente qui tramite la rappresentazione dello spazio soggetto e qui tramite la rappresentazione dello spazio variabile.)Vh′α
Una risposta alla richiesta di @Antoni Parellada nei commenti. È equivalente se si preferisce parlare in termini divarianzao in termini didispersione(SS di deviazione): varianza = dispersione / (n-1), dovenè la dimensione del campione. Poiché abbiamo a che fare con un set di dati con lo stesson, la costante non cambia nulla nelle formule. SeXè il dato (con le variabili V, W, U centrate), quindi la composizione di autogendenza della sua matrice di covarianza (A) produce gli stessi autovalori (varianze dei componenti) e autovettori come l'automisposizione della matrice di dispersione (B) X ′ Xa,b/(n−1)nnXX′Xottenuto dopo la divisione iniziale di per √X fattore. Successivamente, nella formula di un caricamento (vedere la sezione centrale della risposta),a1=h⋅s1⋅cosϕ, il terminehèst. deviazione √n−1−−−−−√a1=h⋅s1⋅cosϕh in (A) ma dispersione radice (cioè norma)‖V‖in (B). Il termines1, che equivale a1,èlam delcomponenteF1standardizzata. deviazione √varV−−−−√∥V∥s11F1 in (A) ma dispersione radice‖F1‖in (B). Infine,cosϕ=rè la correlazioneinsensibileall'utilizzo din-1nei suoi calcoli. Così, abbiamo semplicementeparliamoconcettualmente delle varianze (A) o di scatter (B), mentre i valori stessi rimangono gli stessi nella formula in entrambi i casi.varF1−−−−−√∥F1∥cosϕ=rn−1