DeepMind afferma che la loro profonda rete Q (DQN) è stata in grado di adattare continuamente il suo comportamento mentre imparava a giocare con 49 giochi Atari.
Dopo aver appreso tutti i giochi con la stessa rete neurale, l'agente era in grado di giocarli tutti a livelli "sovrumani" contemporaneamente (ogni volta che veniva presentato in modo casuale con uno dei giochi) o poteva essere buono solo in un gioco alla volta perché passare richiesto un re-apprendimento?