I coefficienti di correlazione phi e Matthews sono lo stesso concetto? In che modo sono correlati o equivalenti al coefficiente di correlazione di Pearson per due variabili binarie? Presumo che i valori binari siano 0 e 1.
Correlazione di Pearson tra due variabili aleatorie di Bernoulli ed y è:
dove
Coefficiente Phi da Wikipedia:
In statistica, il coefficiente phi (indicato anche come "coefficiente medio di contingenza quadrata" e indicato da o ) è una misura dell'associazione per due variabili binarie introdotte da Karl Pearson. Questa misura è simile al coefficiente di correlazione di Pearson nella sua interpretazione. Infatti, un coefficiente di correlazione di Pearson stimato per due variabili binarie restituirà il coefficiente phi ...r ϕ
Se abbiamo una tabella 2 × 2 per due variabili casuali ey
Il coefficiente phi che descrive l'associazione di ed è
Coefficiente di correlazione di Matthews da Wikipedia:
Il coefficiente di correlazione di Matthews (MCC) può essere calcolato direttamente dalla matrice di confusione usando la formula:
In questa equazione, TP è il numero di veri positivi, TN il numero di veri negativi, FP il numero di falsi positivi e FN il numero di falsi negativi. Se una delle quattro somme nel denominatore è zero, il denominatore può essere arbitrariamente impostato su uno; ciò si traduce in un coefficiente di correlazione di Matthews pari a zero, che può essere dimostrato essere il valore limite corretto.