Un motivo molto probabile per la correlazione di 2 variabili è che le loro modifiche sono collegate a una terza variabile. Altre probabili ragioni sono la possibilità (se si verificano abbastanza variabili non correlate per la correlazione, alcune mostreranno una correlazione) o meccanismi molto complessi che coinvolgono più passaggi.
Vedi http://tylervigen.com/ per esempi come questo:
Per affermare con sicurezza la causa di A -> B, è necessario un esperimento in cui è possibile controllare la variabile A e non influenzare le altre variabili. Quindi si misura se la correlazione di A e B esiste ancora se si modifica la variabile.
Per quasi tutte le applicazioni pratiche, è quasi impossibile non influenzare anche altre variabili (spesso sconosciute), quindi il meglio che possiamo fare è dimostrare l'assenza di causalità.
Per essere in grado di affermare una relazione causale, inizi con l'ipotesi che 2 variabili abbiano una relazione causale, usi un esperimento per confutare l'ipotesi e se fallisci, puoi affermare con un certo grado che l'ipotesi è vera. Quanto alto deve essere il tuo grado di certezza dipende dal tuo campo di ricerca.
In molti campi è comune o necessario eseguire 2 parti dell'esperimento in parallelo, una in cui la variabile A viene modificata e un gruppo di controllo in cui la variabile A non viene modificata, ma l'esperimento è esattamente lo stesso, ad esempio in caso di medicina ancora attaccare i soggetti con un ago o farli ingoiare pillole. Se l'esperimento mostra una correlazione tra A e B, ma non tra A e B '(B del gruppo di controllo), puoi assumere la causalità.
Esistono anche altri modi per concludere la causalità, se un esperimento non è possibile o sconsigliabile per vari motivi (morale, etica, PR, costo, tempo). Un modo comune è usare la detrazione. Prendendo un esempio da un commento: per dimostrare che il fumo provoca il cancro negli esseri umani, possiamo usare un esperimento per dimostrare che il fumo provoca il cancro nei topi, quindi dimostrare che esiste una correlazione tra fumo e cancro negli esseri umani e dedurre che quindi è estremamente è probabile che il fumo causi il cancro nell'uomo: questa prova può essere rafforzata se confutiamo anche che il cancro provoca il fumo. Un altro modo per concludere la causalità è l'esclusione di altre cause della correlazione, lasciando la causalità come la migliore spiegazione rimanente della correlazione: questo metodo non è sempre applicabile, perché a volte è impossibile eliminare tutte le possibili cause della correlazione (chiamate "percorsi back-door" in un'altra risposta). Nell'esempio del fumo / cancro, probabilmente potremmo usare questo approccio per dimostrare che il fumo è responsabile del catrame nei polmoni, perché non ci sono molte possibili fonti per questo.
Questi altri modi di "provare" la causalità non sono sempre ideali da un punto di vista scientifico, perché non sono così conclusivi come un esperimento più semplice. Il dibattito sul riscaldamento globale è un ottimo esempio per mostrare come sia molto più facile respingere la causalità che non è stata ancora dimostrata in modo conclusivo con un esperimento ripetibile.
Per un sollievo comico, ecco un esempio di esperimento tecnicamente plausibile, ma non consigliabile per motivi non scientifici (morale, etica, PR, costo):