Quali solidi metodi di correlazione sono effettivamente utilizzati?


18

Ho intenzione di fare uno studio di simulazione in cui metto a confronto le prestazioni di diverse tecniche di correlazione robuste con diverse distribuzioni (inclinate, con valori anomali, ecc.). Con robusto , intendo il caso ideale di essere robusto contro a) distribuzioni distorte, b) valori anomali ec) code pesanti.

Insieme alla correlazione di Pearson come base, stavo pensando di includere le seguenti misure più solide:

  • Spearman's ρ
  • Correlazione della curva percentuale (Wilcox, 1994, [1])
  • Ellissoide a volume minimo, determinante di covarianza minima ( cov.mve/ cov.mcdcon l' cor=TRUEopzione)
  • Probabilmente, la correlazione vincolata

Ovviamente ci sono molte altre opzioni (specialmente se includi anche tecniche di regressione robuste), ma voglio limitarmi agli approcci maggiormente usati / per lo più promettenti.

Ora ho tre domande (sentiti libero di rispondere solo a quelle singole):

  1. Esistono altri solidi metodi correlativi che potrei / dovrei includere?
  2. Quali solide tecniche di correlazione sono effettivamente utilizzate nel tuo campo? (Parlando per la ricerca psicologica: Ad eccezione di Spearman , non ho mai visto alcun robusta tecnica di correlazione al di fuori di un documento tecnico bootstrap sta diventando sempre più popolare, ma altre statistiche robuste sono più o meno inesistente finora.).ρ
  3. Esistono già confronti sistematici di più tecniche di correlazione che conosci?

Inoltre, non esitare a commentare l'elenco dei metodi sopra indicati.


[1] Wilcox, RR (1994). Il coefficiente di correlazione della piega percentuale. Psychometrika , 59, 601-616.

Risposte:


3

Venendo da una prospettiva psicologica, la correlazione di Pearson e Spearman sembra essere la più comune. Tuttavia, penso che molti ricercatori in psicologia si impegnino in varie procedure di manipolazione dei dati su variabili costituenti prima di eseguire la correlazione di Pearson. Immagino che qualsiasi esame di robustezza dovrebbe considerare gli effetti di:

  • trasformazioni di una o entrambe le variabili al fine di rendere le variabili approssimative una distribuzione normale
  • adeguamento o cancellazione di valori anomali basati su una regola statistica o conoscenza dei problemi con un'osservazione

1

Ti consiglierei questo eccellente articolo pubblicato su Science nel 2011 che ho precedentemente pubblicato qui. Vi è la proposta di una nuova misura solida insieme a un confronto esaustivo ed eccellente con altri. Inoltre, tutte le misure sono testate sulla robustezza. Si noti che questa nuova misura è anche in grado di identificare più di una relazione funzionale nei dati e anche di identificare relazioni non funzionali.


Grande! Lo esaminerò da vicino. Sembra molto promettente ...
Felix S

1
Puoi mettere il nome dell'articolo per favore? Sembra essere scomparso!
Creatron,

2
Rilevamento di nuove associazioni in set di dati di grandi dimensioni
Miroslav Sabo,

6
Quell'articolo ha ricevuto molte critiche. Sembra essere stato overhyped. Un sacco di media e un sacco di media e PR funzionano, ma sembra fallire gravemente su esempi banali come ▄▀ che riconosce come "lineare". IIRC anche il loro studio non era giusto, poiché usavano i ranghi per il loro metodo; ma rispetto a Pearson invece che alla correlazione di Spearman.
Anony-Mousse - Restituisci Monica


1

La tau di Kendall è molto usata nella teoria della copula, probabilmente perché è una cosa molto naturale da considerare per le copule di Archimede. Trame della tau cumulativa di Kendall furono introdotte da Genest e Rivest come un modo per scegliere un modello tra le famiglie di copule bivariate.

Link al documento di Genest Rivest (1993)


1

Alcune solide misure di correlazione sono:

  1. Coefficiente di correlazione dei ranghi di Spearman

  2. Signum (Blomqvist) Coefficiente di correlazione

  3. Kendall's Tau

  4. Il coefficiente di correlazione assoluta di Bradley

  5. Coefficiente di correlazione di Shevlyakov

Riferimenti:

• Blomqvist, N. (1950) "Su una misura della dipendenza tra due variabili casuali", Annals of Mathematical Statistics, 21 (4): 593-600. • Bradley, C. (1985) “The Absolute Correlation”, The Mathematical Gazette, 69 (447): 12-17. • Shevlyakov, GL (1997) “Sulla stima robusta di un coefficiente di correlazione”, Journal of Mathematical Sciences, 83 (3): 434-438. • Spearman, C. (1904) "La prova e la misurazione dell'associazione tra due cose", American Journal of Psychology, 15: 88-93.


Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.