Analisi di correlazione canonica con correlazione di rango


15

L'analisi di correlazione canonica (CCA) mira a massimizzare la consueta correlazione di momento-prodotto di Pearson (ovvero coefficiente di correlazione lineare) delle combinazioni lineari dei due set di dati.

Ora, considera il fatto che questo coefficiente di correlazione misura solo le associazioni lineari - questa è la vera ragione per cui usiamo anche, ad esempio, coefficienti di correlazione di Spearman- o Kendall- τ (rango) che misurano una connessione monotona arbitraria (non necessariamente lineare) tra variabili.ρτ

Quindi, stavo pensando a quanto segue: un limite di CCA è che tenta solo di catturare l'associazione lineare tra le combinazioni lineari formate a causa della sua funzione oggettiva. Non sarebbe possibile estendere il CCA in un certo senso massimizzando, diciamo, Spearman- invece di Pearson- r ?ρr

Tale procedura porterebbe a qualcosa di statisticamente interpretabile e significativo? (Ha senso, ad esempio, eseguire CCA sui ranghi ...?) Mi chiedo se sarebbe di aiuto quando abbiamo a che fare con dati non normali ...


4
Will OVERALS - analisi lineare canonica che modo ottimale scale (trasforma monotonicamente) variabili per massimizzare correlazioni canoniche - essere di vostro gradimento?
ttnphns,

@ttnphns: Grazie per l'idea, non ne ho mai sentito parlare prima, e sembra davvero interessante! Tuttavia, non credo che risolva il problema: per quanto ne so, è essenzialmente una combinazione di ridimensionamento ottimale e CCA - ma il ridimensionamento ottimale ha davvero senso solo per le variabili categoriali. Non sembra cambiare molto per le variabili continue misurate sulla scala del rapporto (cosa che ho in mente!). Ma correggimi, se sbaglio.
Tamas Ferenci,

1
@ttnphns: Beh, allo stesso modo in cui usi talvolta la correlazione di Spearman su variabili continue! (Ovviamente gestisce i dati come ordinali ... ma comunque li usiamo su variabili decisamente continue per caratterizzare l'associazione monotona generale (e non solo lineare) tra le variabili.) Ecco perché ho pensato che avrebbe avuto senso anche all'interno di CCA ...
Tamas Ferenci,

@Glen_b, hai ragione. Naturalmente le correlazioni tra ranghi sono per qualsiasi monotonicità, che si tratti di dati ordinali o continui. Sono così sorpreso dal mio commento sopra che lo sto eliminando.
ttnphns,

Potresti provare a usare Kernel CCA che in particolare quando usato con funzioni di base radiale ci consente di proiettare i dati in un sottospazio di dimensione infinita.
roni,

Risposte:


6

Ho usato espansioni di spline cubiche limitate durante il calcolo dei variati canonici. Si stanno aggiungendo all'analisi funzioni di base non lineari esattamente come si aggiungerebbero nuove funzionalità. Ciò si traduce in analisi dei componenti principali non lineari. Vedere la R Hmiscpacchetto 's transcanfunzione per un esempio. Il homalspacchetto R va molto oltre.


1
Grazie! L'approccio descritto negli homals era per me nuovo, ma decisamente interessante.
Tamas Ferenci,

4

Il metodo standard di CCA funziona con la matrice del coefficiente di correlazione del momento del prodotto. Per la più grande mgnitudine CC costruisce due variabili composite z1 (n) e z2 (n) mediante una combinazione lineare di due matix (con n righe e variabili m1 e m2) in modo tale che abs (correlazione (z1, z2)) sia massimizzata. Questa funzione oggettiva può essere massimizzata direttamente anche se la correlazione (z1, z2) non è il momento del prodotto ma è definita in modo diverso.

Mishra, SK (2009) "Una nota sull'analisi ordinaria della correlazione canonica di due serie di punteggi di classifica"

http://papers.ssrn.com/sol3/papers.cfm?abstract_id=1328319

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.