"Condizionamento" è una parola della teoria della probabilità: https://en.wikipedia.org/wiki/Conditional_probability
Il condizionamento su C significa che stiamo solo guardando i casi in cui C è vero. "Implicitamente" significa che potremmo non rendere esplicita questa restrizione, a volte nemmeno consapevoli di farlo.
Il punto significa che, quando A e B causano entrambe C, osservando una correlazione tra A e B nei casi in cui C è vera, non significa che esiste una relazione reale tra A e B. È solo condizionamento su C (forse involontariamente) che crea una correlazione artificiale.
Facciamo un esempio.
In un paese esistono esattamente due tipi di malattie, perfettamente indipendenti. Chiamata A: "la persona ha la prima malattia", B: "la persona ha la seconda malattia". Supponiamo che , P ( B ) = 0.1 .P(A)=0.1P(B)=0.1
Ora qualsiasi persona che ha una di queste malattie va dal medico e solo allora. Chiama C: "la persona va a vedere il dottore". Abbiamo .C=A or B
Ora calcoliamo alcune probabilità:
- P(C)=0.19
- P(A|C)=P(B|C)=0.10.19≈0.53
- P(A and B|C)=0.010.19≈0.053
- P(A|C)P(B|C)≈0.28
Chiaramente, se condizionati su C, e B sono molto lontani dall'essere indipendenti. In realtà, condizionati in C, n o t A sembra "causa" BABnotAB .
Se si utilizza l'elenco delle persone che dove registrato dal medico (s) come fonte di dati per l'analisi, poi sembra che ci sia una forte correlazione tra le malattie e B . Potresti non essere consapevole del fatto che l'origine dati è in realtà un condizionamento. Questo è anche chiamato "bias di selezione".AB