Sto cercando di capire l'uso del PCA in un recente articolo di rivista intitolato "Mappare l'attività cerebrale su larga scala con il cluster computing" Freeman et al., 2014 (pdf gratuito disponibile sul sito web del laboratorio ). Usano la PCA sui dati delle serie storiche e usano i pesi della PCA per creare una mappa del cervello.
I dati sono dati di immagini di prova-media, memorizzati come una matrice (chiamata Y nella carta) con n voxel (o luoghi di imaging del cervello) × t punti temporali (la lunghezza di un singolo stimolazione al cervello).
Usano SVD conseguente Y = U S V ⊤ ( V ⊤ indicante trasposta della matrice V
Gli autori affermano che
I componenti principali (le colonne di ) sono vettori di lunghezza t , ei punteggi (le colonne di U ) sono vettori di lunghezza n (numero di voxel), che descrivono la proiezione di ciascun voxel sulla direzione data dalla corrispondente componente , formando proiezioni sul volume, ovvero mappe del cervello intero.
Quindi, i PC sono vettori di lunghezza t . Come posso interpretare che il "primo componente principale spiega la maggiore varianza" come è comunemente espresso nei tutorial di PCA? Abbiamo iniziato con una matrice di molte serie temporali altamente correlate: in che modo una singola serie temporale del PC spiega la varianza nella matrice originale? Comprendo l'intera "rotazione di una nuvola di punti gaussiana sull'asse più vario", ma non sono sicuro di come questo si riferisca alle serie temporali. Cosa significano gli autori per direzione quando affermano: "i punteggi (le colonne di U ) sono vettori di lunghezza n (numero di voxel), descrivendo la proiezione di ciascun voxel sulla direzione data dal componente corrispondente "? Come può un corso temporale di un componente principale avere una direzione?
Per vedere un esempio delle serie temporali risultanti dalle combinazioni lineari dei principali componenti 1 e 2 e la mappa cerebrale associata, vai al seguente link e passa con il mouse sui punti nel grafico XY.
La mia seconda domanda è relativa alle traiettorie (spazio-stato) che creano usando i punteggi dei componenti principali.
Questi vengono creati prendendo i primi 2 punteggi (nel caso dell'esempio "optomotorio" che ho delineato sopra) e proiettano le singole prove (utilizzate per creare la matrice media della prova sopra descritta) nel sottospazio principale mediante l'equazione:
Come puoi vedere dai film collegati, ogni traccia nello spazio degli stati rappresenta l'attività del cervello nel suo insieme.
Qualcuno può fornire l'intuizione di cosa significhi ogni "frame" del film spaziale dello stato, rispetto alla figura che associa la trama XY delle partiture dei primi 2 PC. Che cosa significa in un determinato "frame" per 1 prova dell'esperimento essere in 1 posizione nello spazio di stato XY e un'altra prova essere in un'altra posizione? In che modo le posizioni della trama XY nei film sono correlate alle principali tracce dei componenti nella figura collegata menzionata nella prima parte della mia domanda?