Leggendo Wikipedia sull'analisi di correlazione canonica (CCA) per due vettori casuali e , mi chiedevo se l'ansiosi componente principale (PCA) è la stessa di CCA quando ?Y X = Y
Leggendo Wikipedia sull'analisi di correlazione canonica (CCA) per due vettori casuali e , mi chiedevo se l'ansiosi componente principale (PCA) è la stessa di CCA quando ?Y X = Y
Risposte:
Lascia che sia n × p 1 e Y sia n × p 2 matrici di dati, che rappresentano due set di dati con n campioni (ovvero osservazioni dei vettori di riga casuali X e Y ) in ciascuno di essi.
CCA cerca una combinazione lineare di variabili in X e una combinazione lineare di variabili p 2 in Y in modo tale che siano correlate al massimo tra loro; quindi cerca la coppia successiva, sotto un vincolo di zero correlazione con la prima coppia; eccetera.
Nel caso (e p 1 = p 2 = p ), qualsiasi combinazione lineare in un set di dati avrà banalmente una correlazione con la stessa combinazione lineare in un altro set di dati. Quindi tutte le coppie CCA avranno correlazioni e l'ordine delle coppie è arbitrario. L'unico vincolo rimasto è che le combinazioni lineari dovrebbero essere non correlate tra loro. Esiste un numero infinito di modi per scegliere combinazioni lineari non correlate (si noti che i pesi non devono essere ortogonali nella1 p pspazio tridimensionale) e ciascuno di essi produrrà una soluzione CCA valida. Un modo in tal senso è dato dal PCA, poiché due PC qualsiasi hanno una correlazione zero.
Quindi la soluzione PCA sarà davvero una soluzione CCA valida, ma in questo caso esiste un numero infinito di soluzioni CCA equivalentemente buone.
Matematicamente, look CCA per destra ( ) e sinistro ( b ) vettori singolari di C - 1 / 2 X X C X Y C - 1 / 2 Y Y , che in questo caso è uguale a I , con qualsiasi vettore essere un autovettore . Quindi a = b può essere arbitrario. CCA poi ottiene i pesi combinati lineari C - 1 / 2 X X un e C - 1 / 2 Y Y b. In questo caso si riduce a prendere in modo arbitrario e trasformandola con , che sarà certamente produrre direzioni non correlate .
vectors X and Y
Sono due variabili (colonne di dati) o due casi (righe); dato che eseguiremo le analisi delle variabili. 2)X and Y are the same
Volevi dire che X = Y o in qualche altro modo?