È facile saltare su un carrozzone dicendo che il gioco di Alpha-Zero è "più" umano rispetto ai precedenti programmi di scacchi per computer in quanto è saltare sul carro opposto e dire che il gioco di Alpha-Zero è completamente "alieno". Non è chiaro che la commedia di Alpha-zero sia "più umana", specialmente data la nostra tendenza umana verso l'antropomorfismo.
Gli scacchi come una lotta della mente (umana)
Ma negli scacchi questa tendenza è vera? Magnus Carlsen una volta ha parlato di come i computer "tradizionali" in generale non abbiano creatività umana dicendo:
"Gli scacchi riguardano la lotta tra le menti umane. Questo è ciò che lo rende eccitante. Gli scacchi del computer sono meccanici, asciutti e insipidi. Le mosse sono molto forti, ovviamente, ma non c'è stile. Se provi a giocare contro un computer di scacchi , non solo perderai con una certezza molto elevata, ma ti annoierai anche nel processo.
Magnus Carlsen non ha visto prove di stili umani di gioco nei tradizionali computer di scacchi. Quindi esaminiamo se il recente risultato di Alpha-Zero ha annullato questa prospettiva e ci ha spostato verso qualcosa di più simile a noi stessi.
Se per "simil-umano" intendi recitare un comportamento che mostra più probabilità di attrarre il nostro senso di antropomorfismo "lo stile di Alpha-zero sembra più umano? Come testiamo davvero questo miope soggettivo che ama proiettare su cose non umane? Chiediamolo: l'algoritmo "seleziona selettivamente meglio" o mostra "una scelta creativa più umana" nel suo stile di gioco?
I creatori dell'algoritmo indicano che, a differenza dello Stoccafisso che utilizza un algoritmo di ricerca Alpha-Beta, Alpha-Zero utilizza un algoritmo di ricerca dell'albero di Monte-Carlo (MCTS) che accetta come input parametri ponderati θ costruiti da risultati precedenti ~ Pagina 3. Mastering Chess and Shogi di Self-Play con un algoritmo di apprendimento di rinforzo generale ).
Quindi l'algoritmo non mostra alcuna scelta. Si impegna effettivamente in una ricerca Monty-carlo casuale ma probabilistica in cui i possibili percorsi di ricerca disponibili sono sempre più pregiudicati dai risultati precedenti. Alpha-zero ha scelto di ottimizzare il suo stile di gioco in questo modo o è stata la scelta dei suoi programmatori?
Alpha-zero ha sempre tutte le mosse possibili a sua disposizione per essere prese in considerazione o alcune mosse sono pregiudicate algoritmicamente in un modo che imita l'esperienza che può essere interpretata dall'uomo in modo antropomorfico?
Inizialmente aveva tutte le mosse disponibili, quindi il suo "stile" era del tutto casuale. Tuttavia, poiché la sua ricerca è sempre più e in modo ottimale vincolata da precedenti successi o insuccessi, il suo stile sta effettivamente cambiando verso la modalità con cui i suoi programmatori l'hanno incatenato. Questo è "più umano" però? Confronta questo con Magnus Carlesen che a volte sceglierà mosse meno ottimali perché sono più creative :
Magnus Carlsen: "Apprezzo creare qualcosa di unico"
Scacchi come lotta della mente (aliena)
Gli umani possono scegliere i criteri che guidano il loro stile di gioco (ad esempio, ho spesso scelto impulso ed errore nel mio stile). Molti vedono il gioco Alpha-Zero sia scacchi e andare come decisamente Alien . Nick Hynes, uno studente laureato presso il MIT's Computer Science and Artificial Intelligence Laboratory (CSAIL) osserva:
“Quello che stiamo vedendo qui è un modello libero da pregiudizi e presupposti umani: può imparare tutto ciò che determina è ottimale, il che può effettivamente essere più sfumato delle nostre stesse concezioni dello stesso. È come una civiltà aliena che inventa la propria matematica che gli permette di fare cose come viaggiare nel tempo ... "
Allo stesso modo il GM Peter Heine Nielsen disse a Chess.com :
"Dopo aver letto il giornale ma soprattutto visto i giochi che ho pensato, beh, mi sono sempre chiesto come sarebbe se una specie superiore fosse atterrata sulla terra e ci avesse mostrato come giocano a scacchi. Sento che ora lo so."
Sembra che la maggior parte reagisca allo stile di gioco emergente di Alpha-zero come "gioco alieno" e non come "più umano".
Pertanto c'è motivo di non essere d'accordo con le risposte sopra che dicono "sì".