Il CCA tra due set di dati identici equivale al PCA in questo set di dati?


9

Leggendo Wikipedia sull'analisi di correlazione canonica (CCA) per due vettori casuali e , mi chiedevo se l'ansiosi componente principale (PCA) è la stessa di CCA quando ?Y X = YXYX=Y


Per favore, chiarisci: 1) vectors X and YSono due variabili (colonne di dati) o due casi (righe); dato che eseguiremo le analisi delle variabili. 2) X and Y are the sameVolevi dire che X = Y o in qualche altro modo?
ttnphns,

@ttnphns: 1) e sono due vettori casuali. Sono due vettori di variabili casuali, due serie di colonne di dati, non due casi (righe). 2) . Y X = YXYX=Y
Tim

Se ogni set è costituito da una singola variabile, c'è una correlazione canonica che è esattamente la Pearson r tra di loro; e CCA diventa regressione lineare di X per Y e viceversa. La decomposizione di quella r per mezzo di PCA è un po 'un'altra storia. PCA e CCA sono analisi diverse.
ttnphns,

Ciao, @Tim, mi chiedo se la mia risposta sia stata utile o se hai ancora qualche domanda in più? In tal caso, sarei felice di chiarire.
Amoeba,

@amoeba: Sì, lo è. Non ho ulteriori domande in questo momento e leggerò la tua risposta in seguito. Grazie per la tua risposta. + 1
Tim

Risposte:


6

Lascia che sia n × p 1 e Y sia n × p 2 matrici di dati, che rappresentano due set di dati con n campioni (ovvero osservazioni dei vettori di riga casuali X e Y ) in ciascuno di essi.Xn×p1Yn×p2nXY

CCA cerca una combinazione lineare di variabili in X e una combinazione lineare di variabili p 2 in Y in modo tale che siano correlate al massimo tra loro; quindi cerca la coppia successiva, sotto un vincolo di zero correlazione con la prima coppia; eccetera.p1Xp2Y

Nel caso (e p 1 = p 2 = p ), qualsiasi combinazione lineare in un set di dati avrà banalmente una correlazione con la stessa combinazione lineare in un altro set di dati. Quindi tutte le coppie CCA avranno correlazioni e l'ordine delle coppie è arbitrario. L'unico vincolo rimasto è che le combinazioni lineari dovrebbero essere non correlate tra loro. Esiste un numero infinito di modi per scegliere combinazioni lineari non correlate (si noti che i pesi non devono essere ortogonali nellaX=Yp1=p2=p1 p p11ppspazio tridimensionale) e ciascuno di essi produrrà una soluzione CCA valida. Un modo in tal senso è dato dal PCA, poiché due PC qualsiasi hanno una correlazione zero.

Quindi la soluzione PCA sarà davvero una soluzione CCA valida, ma in questo caso esiste un numero infinito di soluzioni CCA equivalentemente buone.


Matematicamente, look CCA per destra ( ) e sinistro ( b ) vettori singolari di C - 1 / 2 X X C X Y C - 1 / 2 Y Y , che in questo caso è uguale a I , con qualsiasi vettore essere un autovettore . Quindi a = b può essere arbitrario. CCA poi ottiene i pesi combinati lineari C - 1 / 2 X X un e C - 1 / 2 Y Y babCXX1/2CXYCYY1/2Ia=bCXX1/2aCYY1/2b. In questo caso si riduce a prendere in modo arbitrario e trasformandola con , che sarà certamente produrre direzioni non correlate .CXX1/2

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.