Correlazione = 0,2 significa che esiste un'associazione "solo in 1 su 5 persone"?


48

In The Idiot Brain: A Neuroscientist spiega a cosa ti serve davvero la testa , Dean Burnett ha scritto

La correlazione tra altezza e intelligenza viene generalmente citata in circa , il che significa che altezza e intelligenza sembrano essere associate solo in su .0.215

Per me, questo sembra sbagliato: capisco la correlazione più come l'errore (mancanza di) che otteniamo quando proviamo a prevedere una misura (qui l'intelligenza) se l'unica cosa che sappiamo di quella persona è l'altra misura (qui altezza). Se la correlazione è o , allora non facciamo alcun errore nella nostra previsione, se la correlazione è , allora c'è più errore. Pertanto la correlazione si applicherebbe a chiunque, non solo a su persone.110.815

Ho esaminato questa domanda ma non sono abbastanza bravo in matematica per capire la risposta. Questa risposta che parla della forza della relazione lineare sembra in linea con la mia comprensione, ma non ne sono sicuro.


6
@JamesPhillips, quello a cui ti riferisci è , non stesso. Se allora quindi 4%. r2rr=0.2r2=0.04
Richard Hardy,

4
Il 4 percento ha molto più senso del 20 percento, grazie per la correzione, sono d'accordo con te.
James Phillips,

29
Questo campione dello 0,01% del libro mi fa chiedermi quali sciocchezze si possano trovare nel resto ...
Nick Cox,

11
Ho preferito questo post perché è proprio il tipo di domanda estremamente semplice che, quando viene chiesto a uno studente stats 001 (o qualsiasi altro neofita, o un candidato di lavoro), determinerà istantaneamente e inequivocabilmente se capiscono cosa significa correlazione.
whuber

4
Smetterei di leggere quel libro, proprio ora
PhD

Risposte:


69

Il passaggio citato è effettivamente errato. Un coefficiente di correlazione quantifica il grado di associazione nell'intera popolazione (o campione, nel caso del coefficiente di correlazione del campione). Non divide la popolazione in parti con una parte che mostra un'associazione e l'altra parte no. Esso potrebbe essere il caso che la popolazione realtà consiste di due sottopopolazioni con differenti gradi di associazione, ma un coefficiente di correlazione sola non implica questo.


19
Inoltre, anche in una popolazione in cui il 20% delle persone mostrava una perfetta correlazione tra altezza e intelligenza e l'80% mostrava una correlazione zero, la correlazione a livello di popolazione non è necessariamente 0,2. L'affermazione è sbagliata in diversi modi!
Nuclear Wang,

Accadono cose strane con i thread che entrano nell'elenco Hot Network. Questa risposta è ovviamente corretta e corretta ... ma 57 voti ?! :-)
ameba dice Reinstate Monica il

2
@amoeba Se pensi che sia selvaggio, controlla la mia risposta con il punteggio più alto .
Kodiologo,

Haha, tu sei il maestro!
ameba dice di reintegrare Monica il

Conta come una traina a +1 qualcosa solo per favorire la stranezza che è SE?
Nat,

18

No, 0,2 non significa che 1 persona su 5 mostra correlazione. Non so come possa scrivere questa assurdità.

Ecco la fonte del numero 0.2: "Sulle fonti della correlazione altezza-intelligenza: nuove intuizioni da un modello ACE bivariato con accoppiamento assortito", https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3044837/ Apparentemente, la correlazione è solida.

Lo sapevo già: il mio QI è aumentato considerevolmente con la mia altezza quando sono diventato più alto. Ora so perché non sto più diventando più intelligente: la mia altezza è stabile.

Questo era uno scherzo, ovviamente, ma evidenzia il problema con l'argomento dell'autore di quel libro "Idiota": nessuno sta misurando nella correlazione soggetto di altezza e QI, almeno per quanto ne so. Non sono sicuro di come lo faresti in modo pulito, ci sarebbero così tante confusioni.

Detto che i ricercatori stanno usando trucchi come guardare all'interno dei gemelli e all'interno delle correlazioni familiari di altezza e QI, questo li aiuta ad affrontare problemi di confusione. Presumibilmente, i gemelli stanno crescendo in un ambiente simile e hanno lo stesso DNA, quindi negli studi di osservazione aiuta ad affrontare l'endogeneità e altri problemi. Tuttavia, se si mette tutto da parte, la linea di fondo è che "0,2 correlazione" non fornisce alcuna base per dire assurdità come in alcune persone c'è correlazione e in altre no. È solo una ridicola interpretazione dei risultati dello studio di correlazione.


8
-1: mentre capisco lo spirito dell'ultimo paragrafo di questa risposta, credo che aumenti la confusione in quanto introduce inutilmente il concetto di causalità (il whyqui non è pertinente).
Jorge Leitao,

1
Devi essere uno su cinque per il quale esiste una correlazione.
Carsten S,

@ JorgeLeitão Certo che no, non è implicita alcuna causalità, sono cresciute insieme, è correlativo! :)
Firebug,

@ JorgeLeitão, semmai la ricerca NN mostra che le dimensioni contano. Sia un cervello più grande che un campione più grande. Quindi, quando cresciamo, il nostro cervello aumenta e passiamo più cose attraverso di loro, quindi dovremmo diventare più intelligenti. Inoltre, gli uomini sono in media più alti delle donne, quindi devono essere anche più intelligenti, in media.
Aksakal,

Ah, che carico di sciocchezze.
Lightness Races con Monica

8

L'ironia nell'affermazione è quasi troppo spessa per essere analizzata. Dato il titolo del testo, presumo che fosse inteso un po 'ironico. Tuttavia, il tuo "istinto" dicendo che questo è sbagliato è probabilmente sulla strada giusta, se l'intuizione conta qualcosa. Sfortunatamente, molti resoconti scientifici sfuggono all'intuizione quando si tratta di concetti che non abbiamo incontrato.

È possibile che, quando si misura un'associazione tra e , la correlazione tra e sia 1,0 nel 20% della popolazione e 0 nel restante 80%. L'effetto netto è che nel complesso la correlazione di e è 0,2. Lo vediamo continuamente in farmacoepidemiologia: un farmaco sperimentale è considerato "efficace" se in media vi è un beneficio positivo; molti farmaci in circolazione, alcuni dei quali potresti assumere, potrebbero farti del male a causa di interazioni con il tuo comportamento o la tua genetica, ma nessuno lo sa davvero.XYXYXY

Quanto sopra è solo una possibile interpretazione di una correlazione di 0,2; è estremamente inverosimile perché così poche cose nella vita hanno una correlazione di 1 o 0, e meno cose hanno ancora modifiche agli effetti abbastanza forti da produrre correlazioni così discrepanti.


1
"È possibile che, quando si misura un'associazione tra X e Y, la correlazione tra X e Y sia 1,0 nel 20% della popolazione e 0 nel restante 80%." - nello studio che ho pubblicato hanno esaminato all'interno della famiglia e tra le correlazioni tra gemelli, sono diverse dalla popolazione complessiva. Tuttavia, sono sicuro che non è quello che intendeva l'autore del libro, è come interpreta quale correlazione è il problema
Aksakal,

@Aksakal è interessante notare che questi metodi dei componenti della varianza sono intesi per stimare la stessa correlazione a livello di popolazione che verrebbe misurata in una popolazione, affermano solo di usare l'ereditarietà per "radere" la varianza fenotipica attribuibile all'attuale influenza ambientale (la componente E dell'ACE) modello): un'importante fonte di confusione nell'ipotesi considerata.
AdamO,

10
Se la correlazione è 1 nel 20% della popolazione e 0 nell'80%, non ne consegue che nel complesso sia 0,2. Dipende dalla varianza relativa in ogni sottopopolazione.
ameba dice di reintegrare Monica il

1
@amoeba sì, buon punto, sottolinea ulteriormente ciò che uno scenario idiopatico giustificherebbe tale affermazione.
AdamO,

4
"Presumo che fosse inteso un po 'di ironia." Sei più caritatevole di me. È semplicemente sbagliato. Non vedo alcun motivo per pensare che l'autore abbia intenzionalmente sbagliato in un modo che avrebbe dovuto essere intelligente. L'interpretazione più caritatevole è che l'autore ha voluto sottolineare la natura probabilistica di una correlazione e ha scelto senza pensarci un cattivo modo per illustrarlo, un modo in cui l'autore stesso probabilmente sarebbe d'accordo non ha davvero senso se glielo facesse notare.
John Coleman,

2

Sarebbe difficile trovare un'interpretazione significativa, per non dire corretta. L'associazione non è una proprietà dei singoli punti dati. Se avessi solo l'altezza e l'intelligenza di una persona, come potresti dire se l'altezza e l'intelligenza sono associate? Suppongo che se avessimo la media dell'altezza e dell'intelligenza, potremmo dire che tutti sopra la media in entrambi, o sotto la media in entrambi, stanno mostrando una "associazione". Ma se avessi dati completamente casuali (nessuna correlazione), dovresti aspettarti che metà delle persone mostri "associazione" in questo senso. Ho generato un set di dati casuali con correlazione intorno a .2 (in realtà .22) e ho scoperto che 55 ha mostrato "associazione" in questo senso.

È possibile che Y sia una funzione crescente di X e la correlazione tra loro sia solo .5; sarebbe sciocco dire che solo la metà delle persone mostra un'associazione se ogni persona ha un'intelligenza più alta di ogni persona più bassa e un'intelligenza più bassa di tutte più alte. Inoltre, è teoricamente possibile avere un valore anomalo che crea tutta la correlazione e la correlazione dell'insieme senza quel punto è zero. È anche possibile che il 20% della popolazione abbia una correlazione negativa e l'altro 80% abbia anche una correlazione negativa e che la correlazione totale sia .2.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.