"Eugene Goostman" ha davvero superato il test di Turing?


18

Si dice che "Eugene Goostman", un programma per computer sviluppato per simulare un ragazzo di 13 anni, sia riuscito a convincere il 33% dei giudici che era umano, e quindi ha superato il test di Turing.

Il programma per computer, noto anche come chatbot, fingeva di essere un ragazzo ucraino di 13 anni per il quale l'inglese era una seconda lingua, qualcosa di molto diverso.

Per me, Eugene suona esattamente come dovrebbe fare un chatbot mediocre: ripetitivo, senza senso e pieno di non-sequiturs. Non so come abbia convinto i giudici (che sembrano poco professionali).

Molte persone hanno criticato Eugene come il prof. Stevan Harnad, che ha affermato "Non ha senso" e "Non abbiamo superato il test di Turing. Non siamo nemmeno vicini."

Le opinioni sono diverse, ma mi piacerebbe davvero sapere se ha superato ufficialmente il test?

Si dice anche che:

Due premi una tantum che non sono mai stati assegnati. 25K è offerto per il primo chatterbot che i giudici non possono distinguere da un vero essere umano e che può convincere i giudici che l'essere umano è il programma per computer. $ 100.000 sono la ricompensa per il primo chatterbot che i giudici non possono distinguere da un vero essere umano in un test di Turing che include la decifrazione e la comprensione di input di testo, visivi e uditivi. Una volta raggiunto questo obiettivo, la competizione annuale finirà.

Significa che Eugene ha vinto $ 25.000?


2
È molto importante che i giudici sappiano di essere nella situazione.
Thorbjørn Ravn Andersen,

3
2/3 dei giudici pensava che questo "bot" non fosse umano. Per me questo dice che la natura artificiale di questa interazione era evidente a più della maggioranza dei giudici. Lo definirei un chiaro fallimento. (E anche se "Eugene" "vincesse" - come fa una persona artificiale a raccogliere soldi veri? BitCoin? :-)
Bob Jarvis - Reinstalla Monica il

Potete fornire una conversazione di esempio? Interagisco quotidianamente con gli ucraini e il modo in cui parlano inglese è facilmente riconoscibile.
Stephan Bijzitter,

Risposte:


18

Non esiste un "test ufficiale di Turing", quindi non esiste il concetto di "superare ufficialmente il test". Turing ha descritto una metodologia che si potrebbe usare per valutare le intelligenze artificiali. Gli organizzatori dell'evento vinto da Eugene Goostman hanno implementato tale metodologia in un modo particolare e il programma ha soddisfatto i criteri scelti dagli organizzatori. In tal senso, ha superato il test.

Poiché non esiste un "test ufficiale di Turing", potrebbe essere più appropriato dire che Eugene Goostman ha superato un test di Turing o addirittura superato un test di tipo Turing. E 'improbabile che i media avrebbero salire su tali sottigliezze, soprattutto in considerazione la fama di Turing e l'idea di " il test di Turing" nella coscienza pubblica.


3
Oltre a ciò, Eugene Goostman sarebbe spazzatura nel gioco di imitazione originale di Turing ;-)
Steve Jessop

9

Penso che i premi a cui ti riferisci siano il Premio Loebner . Secondo la pagina di Wikipedia (vedi link precedente), il vincitore per il 2014 è "Rose" di Bruce Wilcox. Quel programma non ha vinto uno dei premi una tantum, ma ha ricevuto $ 4.000 in premi in denaro. 'Eugene Goostman' ha gareggiato nel 2005 e nel 2008, arrivando secondo in entrambe le occasioni.

Il concorso "Eugene Goostman" vinto è stato organizzato da Kevin Warwick dell'Università di Coventry in occasione dei 60 anni dalla morte di Alan Turing. Non sono a conoscenza di alcun premio in denaro.

Dai un'occhiata alla versione di Ray Kurzweil sulla concorrenza e sul programma in questione. Estratto:

Il professor Warwick afferma che il test era "senza restrizioni". Tuttavia, avere il chatbot che afferma di essere un bambino di 13 anni, e uno per il quale l'inglese non è la prima lingua, è effettivamente una restrizione. Inoltre, le interazioni sarebbero state limitate a cinque minuti ciascuna. C'è un'alta probabilità di ingannare giudici ingenui in un periodo di tempo così breve.

Ho chattato con il chatbot Eugene Goostman e non sono rimasto colpito. Eugene non tiene traccia della conversazione, si ripete parola per parola e spesso risponde con chatbot tipici non sequiturs.

Ho anche scoperto che questo è un bel commento: CABLATO - Quel computer ha effettivamente ottenuto una F sul test di Turing


1
Mi è piaciuta anche la parte Wired, in particolare "In una competizione del 1991, un bot chiamato PC Therapist è stato in grado di convincere cinque giudici su 10 a credere che fosse umano". Anche per quanto riguarda la soglia "speciale"> 30%: "Quindi il padre del test di Turing non usava questa come soglia di intelligenza, stava semplicemente affermando la sua previsione di dove pensava che i computer sarebbero stati cinque decenni in futuro. "
Fizz,

10
In sintesi: il bot Eugene "ha superato" questo test non simulando l'intelligenza umana, ma simulando la stupidità umana.
duskwuff,

2

Aggiunta di un link Wikipedia per una maggiore profondità sul "originale" Test di Turing . Ci sono molti test chiamati "test di Turing". Wikipedia menziona "almeno 3 versioni primarie". Il test superato da Eugeene non è nessuno di questi 3. Il test superato da Eugeene non è stato ideato da Alan Turing, ma era un test chiamato test di Turing, ispirato da Alan Turing, ed Eugeene lo ha superato.

La parte che menziona almeno 3 versioni primarie del test di Turing:

Saul Traiger sostiene che esistono almeno tre versioni primarie del test di Turing, due delle quali sono offerte in "Computing Machinery and Intelligence" e una che descrive come "Standard Interpretation". Mentre si discute se l '"Interpretazione standard" sia quella descritta da Turing o, invece, basata su una lettura errata del suo articolo, queste tre versioni non sono considerate equivalenti e i loro punti di forza e di debolezza sono distinti.

Versione 1

Il gioco originale di Turing descriveva un semplice gioco di società che coinvolgeva tre giocatori. Il giocatore A è un uomo, il giocatore B è una donna e il giocatore C (che interpreta il ruolo dell'interrogatore) è di entrambi i sessi. Nel gioco d'imitazione, il giocatore C non è in grado di vedere né il giocatore A né il giocatore B e può comunicare con loro solo attraverso note scritte. Ponendo domande al giocatore A e al giocatore B, il giocatore C cerca di determinare quale dei due è l'uomo e quale la donna. Il ruolo del giocatore A è quello di indurre l'interrogatore a prendere la decisione sbagliata, mentre il giocatore B tenta di aiutare l'interrogatore a prendere la decisione giusta.

Versione 2

La seconda versione apparve più tardi nel documento di Turing del 1950. Simile al test del gioco d'imitazione originale, il ruolo del giocatore A è svolto da un computer. Tuttavia, il ruolo del giocatore B è svolto da un uomo piuttosto che da una donna. [...] In questa versione, sia il giocatore A (il computer) che il giocatore B stanno cercando di indurre l'interrogatore a prendere una decisione errata.

Versione 3

L'intesa comune afferma che lo scopo del test di Turing non è specificamente quello di determinare se un computer è in grado di ingannare un interrogatore nel credere che sia un essere umano, ma piuttosto se un computer potrebbe imitare un essere umano. Mentre c'è qualche disputa sul fatto che questa interpretazione sia stata intesa da Turing - Sterrett ritiene che lo sia stata e quindi confonde la seconda versione con questa, mentre altre, come Traiger, non lo fanno - ciò ha comunque portato a ciò che può essere visto come " interpretazione standard ". In questa versione, il giocatore A è un computer e il giocatore B una persona di entrambi i sessi. Il ruolo dell'interrogatore non è determinare quale sia maschio e quale femmina, ma quale sia un computer e quale essere umano. Il problema fondamentale con l'interpretazione standard è che l'interrogatore non è in grado di differenziare quale risponditore è umano e quale è macchina. Ci sono problemi di durata, ma l'interpretazione standard generalmente considera questa limitazione come qualcosa che dovrebbe essere ragionevole.

Al contrario, il test superato da Eugeene ha fatto giudici umani chiacchierare con un chatbot per 5 minuti, dopo di che hanno dovuto decidere se si trattava di un bot o meno.


0

Sì, ha vinto "un" test di Turing che ha seguito il più possibile la descrizione originale di Alan Turing.
Questa non era tuttavia la versione in denaro da $ 25000 che è il premio Loebner, le cui specifiche differiscono dalla descrizione di Alan Turing.
Ancora più importante, Alan Turing non ha mai significato che si trattasse in primo luogo di un vero test , quindi il risultato non è la prova dell'intelligenza, se è quello che volevi davvero sapere.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.