La correlazione equivale all'associazione?


27

Il mio professore di statistica afferma che la parola "correlazione" si applica rigorosamente alle relazioni lineari tra variate, mentre la parola "associazione" si applica ampiamente a qualsiasi tipo di relazione. In altre parole, afferma che il termine "correlazione non lineare" è un ossimoro.

Da quello che posso fare di questa sezione nell'articolo di Wikipedia su " Correlazione e dipendenza ", il coefficiente di correlazione di Pearson descrive il grado di "linearità" nella relazione tra due variate. Ciò suggerisce che il termine "correlazione" si applica di fatto esclusivamente alle relazioni lineari.

D'altra parte, una rapida ricerca su Google di " correlazione non lineare " rivela una serie di articoli pubblicati che usano il termine.

Il mio professore ha ragione o la "correlazione" è semplicemente sinonimo di "associazione"?


1
Viceversa esiste anche "associazione lineare".
Bogdanovist,

Risposte:


37

No; la correlazione non è equivalente all'associazione. Tuttavia, il significato della correlazione dipende dal contesto.

La definizione di statistica classica è, per citare da Kotz e Johnson's Encyclopedia of Statistical Sciences "una misura della forza della relazione lineare tra due variabili casuali". Nella statistica matematica la "correlazione" sembra generalmente avere questa interpretazione.

Nelle aree applicate in cui i dati sono comunemente ordinali piuttosto che numerici (ad es. Psicometria e ricerche di mercato) questa definizione non è così utile in quanto il concetto di linearità presuppone dati con proprietà a scala di intervallo. Di conseguenza, in questi campi la correlazione viene invece interpretata come indicante un modello bivariato crescente o decrescente monotonicamente o una correlazione dei ranghi. Un certo numero di statistiche di correlazione non parametriche sono state sviluppate appositamente per questo (ad esempio, la correlazione di Spearman e la tau-b di Kendall). Talvolta vengono definite "correlazioni non lineari" perché sono statistiche di correlazione che non assumono linearità.

Tra correlazione non statistica spesso significa associazione (a volte con e talvolta senza connotazione causale). Indipendentemente dall'etimologia della correlazione, la realtà è che tra i non statistici ha questo significato più ampio e nessuna quantità di castighi per un uso inappropriato può cambiare questo. Ho fatto un "google" e sembra che alcuni degli usi della correlazione non lineare sembrano essere di questo tipo (in particolare, sembra che alcune persone usino il termine per indicare una relazione liscia e non lineare tra variabili numeriche) .

La natura dipendente dal contesto del termine "correlazione non lineare" forse significa che è ambigua e non dovrebbe essere usata. Per quanto riguarda la "correlazione", devi capire il contesto della persona che usa il termine per sapere cosa significano.


6
+1 Una risposta ponderata e ben informata. Ti preghiamo di considerare di qualificare il "no" iniziale perché ci vuole un po 'di lettura e di pensiero per capire se significa "no, il professore non è corretto" o "no," correlazione "non è sinonimo di" causalità "," oppure la congiunzione dei due.
whuber

Grazie per il commento; Ho modificato la mia risposta di conseguenza.
Tim

1
Questa è una risposta (e una domanda) eccellente che presenta alcuni problemi più ampi di terminologia, lingua e comunicazione in generale di cui tutti dobbiamo occuparci.
Peter Ellis,

3
Allora, cos'è l'associazione?
Pecora,

5

Non vedo molto senso cercare di districare i termini "correlazione" e "associazione". Dopotutto, lo stesso Pearson (e altri) hanno sviluppato una misura di relazione non lineare che hanno chiamato il " rapporto di correlazione ".


1
Sì, a questo punto sembra che siano abbastanza difficili da districare, specialmente data la storia (ad esempio, come dici tu) e la percezione sociale.
Behacad,

2

Sembra che ci sia un malinteso sull'associazione. Le misure di associazione (dimensione dell'effetto) sono inerenti all'analisi quantitativa, non qualitativa.


1
Forse dovresti pensare di trasformarlo in un commento. Le risposte sono di solito un po 'più estese
PhDing del

@Alessandro Yup, più necessari per una risposta, ma l'OP non ha abbastanza reputazione (> +50) per commentare ancora. Forse il moderatore può convertirlo in un commento per lui.
Carl,

0

Direi che la correlazione si applica ai dati quantitativi e l'associazione ai dati qualitativi ed entrambi non hanno una relazione causale obbligatoria.


Cosa intendi con "associazione a dati qualitativi"?
Randel,

0

L'idea che il peso (di un uomo) non sia correlato all'altezza (perché la funzione corrispondente è di 3 ° grado, non lineare) mi sembra molto strana. La correlazione lineare dovrebbe essere trattata come un caso speciale di associazione.


1
Ma quale (o di chi) idea stai discutendo? La correlazione può essere calcolata qui come (b) correlazione tra valori osservati e previsti da qualsiasi combinazione di termini nonché (presumibilmente) (a) correlazione diversa da zero tra peso e altezza.
Nick Cox,

-1

La correlazione e l'associazione sono diverse. La correlazione descrive i tre tipi di relazione positiva, negativa e non correlata. Descrive anche l'entità della correlazione da 0 a 1, da -1 a 0. L'associazione non rivela quali tipi di associazione e quanta associazione.


Qual è la domanda qui?
Christoph Hanck,

Dato che non definisci l'associazione o spieghi in che modo differisce, è difficile capire perché pensi di aver risposto alla domanda. Questo non si aggiunge alle risposte precedenti.
Nick Cox,

-2

Per quanto riguarda la linearità, la risposta di Tim e Nick Cox l'ha coperta completamente. Dove pensavo di poter contribuire è un modo chiaro di pensare alla differenza tra associazione e correlazione.

L'associazione --- misura quanto due variabili siano strettamente correlate (cioè se sono dipendenti o indipendenti).

Correlazione --- misura in che modo due variabili sono correlate (cioè positivo o negativo).


Alla fine, direi che non si può mai sbagliare trattandoli distintamente che aiuterà con l'interpretazione e le analisi a lungo termine. Spero che sia di aiuto.


2
Non ho votato in negativo e grazie per il commento positivo (ho appena applicato una modifica). Sfortunatamente, confonde la discussione. Le misure di associazione spesso non hanno nulla a che fare con quale variabile se ne dipende. La correlazione misura anche "quanto da vicino": ogni definizione di correlazione si basa su una definizione specifica del modo in cui le variabili sono (idealmente) correlate (linearmente, monotonicamente, ecc.) Gli esempi di famiglia in realtà non aiutano, anche come analogie: egmother, father, uncle non sono variabili quantitative nell'esempio. Quindi, scusa, ma la distinzione che fai non è affatto chiara.
Nick Cox il

Inoltre, "sangue condiviso" e "estraniamento" sono abbastanza diversi!
Nick Cox il
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.