È risaputo che "la correlazione non equivale alla causalità", ma l'apprendimento automatico sembra essere quasi interamente basato sulla correlazione. Sto lavorando a un sistema per stimare le prestazioni degli studenti in base alle loro domande passate. A differenza di altre attività, come la ricerca di Google, questo non sembra il tipo di sistema che può essere facilmente giocato, quindi il nesso di causalità non è realmente rilevante a tale riguardo.
Chiaramente, se vogliamo fare esperimenti per ottimizzare il sistema, dovremo preoccuparci della distinzione correlazione / causalità. Ma, dal punto di vista della semplice costruzione di un sistema per selezionare domande che potrebbero essere del livello di difficoltà appropriato, questa distinzione ha qualche importanza?