Perché gli esperti di scacchi sono stati sorpresi dalla vittoria di AlphaZero contro lo stoccafisso?


10

Di recente è stato portato alla mia attenzione che gli esperti di scacchi hanno preso il risultato di questa ormai famosa partita come una seccatura.

Vedi: Il nuovo miglior giocatore di scacchi è un impavido algoritmo spavaldo

Come non esperto di Chess and Chess AI, la mia ipotesi era che, in base alle prestazioni di AlphaGo e alla convalida di quel tipo di metodo in relazione ai giochi combinatori, era che l'IA più vecchia non avrebbe avuto possibilità.

  • Perché la vittoria di AlphaZero è stata sorprendente?

Risposte:


14

Buona domanda.

Innanzitutto, in Go deepmind non c'erano avversari sovrumani da sfidare. I motori Go non erano vicini al livello più alto dei migliori giocatori umani. Negli scacchi, tuttavia, i motori sono 500 punti ELO più forti dei migliori giocatori umani. Questa è una differenza enorme. La quantità di lavoro che è stata dedicata ai motori di scacchi contemporanei è sconcertante. Stiamo parlando di milioni di ore in programmazione, centinaia di migliaia di iterazioni. È un enorme corpus di conoscenza e lavoro. Superare e superare tutto ciò in 4 ore è sbalorditivo.

In secondo luogo, non è tanto il risultato stesso che sorprende i maestri di scacchi, quanto piuttosto il modo in cui AlphaZero gioca a scacchi. È abbastanza ironico che un sistema che non aveva conoscenze o competenze umane giochi più come noi. I motori sono noti per giocare mosse dall'aspetto brutto, quelle che mancano di armonia, ecc. È difficile da spiegare a un giocatore senza scacchi, ma esiste una "mossa artificiale" come i motori contemporanei escogitano spesso. AlphaZero non gioca affatto in questo modo. Ha uno stile molto umano in cui domina i pezzi dell'avversario con un profondo gioco strategico e straordinari sacrifici di posizione. AlphaZero gioca nel modo in cui aspiriamo, combinando una profonda comprensione della posizione con la precisione del calcolo di un motore.

Modifica Oh e ho dimenticato di menzionare qualcosa sul risultato stesso. Se non hai familiarità con gli scacchi del computer, potrebbe non sembrare sconcertante, ma lo è.

In questi giorni i margini di vittoria che separano i migliori motori contemporanei sono molto sottili. In una partita di 100 partite potresti aspettarti di vedere un risultato come 85 partite pareggiate, 9 vittorie e 6 sconfitte per determinare il motore migliore.

AlphaZero 28 vince e 72 pareggi con zero sconfitte è stata una schiacciata ultraterrena ed era completamente impensabile fino al momento in cui è successo.


Bella risposta. Il tuo punto sul confronto tra gli scacchi di AI è interessante in termini di limitazione basata sul loopiness degli scacchi e sulla triade Win / Loss / Draw. (Probabilmente, in futuro, avremo bisogno di giochi finiti e intrattabili che consentano un'analisi più dettagliata in termini di risultati.) Conosco la storia dei motori di scacchi e l'enorme quantità di sforzi e conoscenze umane che li hanno investiti, ma il contesto della mancanza di successo riguarda: il molto più complesso 19x19 Go ebbe per me una ramificazione opposta.
DukeZhou

In particolare, la mia ipotesi era che se AlphaGo potesse battere i migliori umani in un gioco significativamente più complesso, sembrava ragionevole che avrebbe battuto non solo i migliori umani, ma i migliori precedenti AI in qualsiasi altro gioco.
DukeZhou

La parte delle mosse artificiali è piuttosto importante, e non qualcosa di cui ho visto parlare giocatori senza scacchi. +1
Stella Biderman,

4

L'MCTS per gli scacchi era stato provato in letteratura con scarso successo. Si presumeva che l'approccio di AlphaGo non avrebbe mai funzionato sugli scacchi, forse su Go ma non sugli scacchi. Improvvisamente, Google ha annunciato che l'approccio stava funzionando e stava battendo il programma di scacchi più forte del mondo con un margine molto significativo.

Prima di Google, a tutti i programmatori di scacchi veniva insegnato a costruire l'euristica nella programmazione del motore era una strategia migliore dell'apprendimento automatico. Indipendentemente dal modo in cui hai implementato le reti neurali, non avrebbe mai funzionato più velocemente di un mucchio di istruzioni bitboard a 64 bit. AlphaGo correva piuttosto lentamente , ma giocava a scacchi più forti.


2

Vedo, in base agli articoli che fornisci, molti livelli di sorpresa nella vittoria:

Gli scacchi sono un gioco difficile da padroneggiare e la controparte aveva le migliori pratiche del mondo, AlphaZero aveva tabula rasa.

L'apprendimento è durato quattro ore e AlphaZero non ha perso nessuna partita di 100.

Lo stile di gioco era un mix alieno di mosse umane e informatiche, aggressive e alcune volte apparentemente sciocche con sacrifici che non hanno idea ma che in realtà stanno rendendo lo status futuro più forte.

La quantità di possibilità prese in considerazione per mossa era inferiore alla controparte, AlphaZero aveva una misteriosa sensazione o intuizione.

La sensazione di rabbia derivava dalla quantità di materiale di formazione con cui AlphaZero si era costruito e dal limite di tempo, che forse non concedeva alla macchina tradizionale un discreto periodo di tempo.


Aaah. Quindi derivava dalla mancanza di fiducia nel nuovo metodo AI. Questo ha senso.
DukeZhou
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.