Esiste un compromesso tra flessibilità ed efficienza?


8

Un'intelligenza generale può essere in grado di apprendere molte cose diverse, ma possedere capacità non equivale ad averla. L '"AGI" deve imparare ... e quel processo di apprendimento può richiedere del tempo. Se vuoi che un AGI guidi una macchina o giochi a Go, devi trovare un modo per "insegnarlo". Tieni presente che non abbiamo mai creato AGI, quindi non sappiamo quanto tempo può durare il processo di formazione, ma sarebbe sicuro assumere stime pessimistiche.

Contrastalo con una "intelligenza ristretta". L'intelligenza artificiale stretta sa già come guidare un'auto o giocare a Go. È stato programmato per essere eccellente in un compito specifico. Non devi preoccuparti di addestrare la macchina, perché è già stata pre-addestrata.

Un'intelligenza generale sembra essere più flessibile di un'intelligenza ristretta. Potresti comprare un AGI e farlo guidare un'auto e giocare a Go. E se sei disposto a fare più allenamento, puoi persino insegnargli un nuovo trucco: come cuocere una torta . Non devo preoccuparmi che si verifichino compiti imprevisti, dal momento che l'AGI alla fine riuscirà a capire come farlo, dato un tempo di addestramento sufficiente. Dovrei aspettare a lungo però.

Un'intelligenza "stretta" sembra essere più efficiente nel compito assegnato, in quanto programmata appositamente per quel compito. Sa esattamente cosa fare e non deve perdere tempo a "imparare" (a differenza del nostro amico AGI qui). Invece di acquistare un AGI per gestire male un mucchio di compiti diversi, preferirei acquistare un mucchio di IA ristretti specializzati. Narrow AI # 1 guida auto, Narrow AI # 2 gioca Go, Narrow AI # 3 cuoce torte, ecc. Detto questo, questo è un approccio molto fragile, dal momento che se dovesse sorgere un compito imprevisto, nessuno dei miei AI stretti sarebbe in grado per gestirlo. Sono disposto ad accettare quel rischio però.

Il mio "pensiero" è corretto? Esiste un compromesso tra flessibilità (AGI) ed efficienza (AI stretto), come quello che ho appena descritto sopra? O è teoricamente possibile che un AGI sia sia flessibile che efficiente?


1
Non è solo limitato a "AGI" vs "forte stretto". Esiste una strategia nota come " soddisfacente " in cui "abbastanza buono" è il massimo che puoi ottenere in b / c decisioni oggettivamente ottimali non raggiungibili. Laddove il tempo di decisione è limitato, su modelli che possono essere risolti o parzialmente risolti, l'euristica semplice può superare l'apprendimento profondo.
DukeZhou

Risposte:


5

Il risultato più pulito che abbiamo su questo problema è il teorema "nessun pranzo libero" . Fondamentalmente, al fine di migliorare le prestazioni di un sistema in una determinata attività, è necessario ridurne le prestazioni in altre attività e quindi esiste un compromesso tra flessibilità ed efficienza.

Ma alla domanda più ampia, o se il tuo modo di pensare è corretto, penso che valga la pena guardare più da vicino a cosa intendi per "intelligenza ristretta". I sistemi di intelligenza artificiale che abbiamo che giocano a Go e guidano le auto non sono nati in grado di fare quelle cose; hanno lentamente imparato come attraverso molti esempi di formazione e un'architettura ben scelta che rispecchia il dominio del problema.

Cioè, le "reti neurali" come metodologia sembrano "generali" in modo significativo; si potrebbe immaginare che un'intelligenza generale possa essere formata risolvendo il problema del meta-apprendimento (ovvero, apprendendo l'architettura che meglio si adatta a un particolare problema mentre si apprendono i pesi per quel problema dai dati di allenamento).

Anche in quel caso, ci sarà ancora un compromesso tra flessibilità ed efficienza; l'intelligenza generale che ha permesso di variare la sua architettura sarà in grado di risolvere molti problemi diversi, ma ci vorrà del tempo per scoprire quale problema sta affrontando. Un'intelligenza bloccata in una particolare architettura funzionerà bene sui problemi per i quali l'architettura è adatta (meglio del generale, dal momento che non ha bisogno di scoprirla) ma meno bene su altri problemi per i quali non è adatta.


1
I teoremi di "No Free Lunch" (NFL) sono generalmente inquadrati in termini di sistemi a scatola nera. Utilizzando le descrizioni whitebox del problema da risolvere e / o la metacognizione sul processo di soluzione, potrebbe essere possibile aggirare la NFL. Vedi anche la mia risposta a questa domanda ai.stackexchange.com/questions/1751/what-are-hyper-heuristics
NietzscheanAI

5

Come ha spiegato Matthew Graves in un'altra risposta Nessun teorema del pranzo libero conferma la flessibilità - compromesso dell'efficienza. Tuttavia, questo teorema sta descrivendo una situazione in cui hai una serie di compiti completamente indipendenti. Questo spesso non regge, poiché molti problemi diversi sono equivalenti nel loro nucleo o almeno hanno qualche sovrapposizione. Quindi puoi fare qualcosa chiamato "apprendimento di trasferimento", il che significa che allenandoti a risolvere un compito impari anche qualcosa sulla risoluzione di un altro (o possibilmente più attività diverse).

Ad esempio in Policy Distillation di Rusu et al. sono riusciti a "distillare" le conoscenze da diverse reti di esperti in una rete generale che alla fine ha sovraperformato ciascuno degli esperti. Gli esperti sono stati formati per compiti specifici mentre il generalista ha appreso la politica finale da questi "insegnanti".


1

Sembrerebbe di si. Un esempio, sebbene non specificamente correlato all'IA, è rappresentato dalla differenza tra computer digitali e computer analogici . Praticamente tutto ciò che pensiamo come un "computer" oggi è un computer digitale con un'architettura von Neumann. E questo perché le cose hanno uno scopo così generale che possono essere facilmente programmate per fare qualsiasi cosa. Ma i computer analogici possono (o potrebbero, negli anni '60 o successivi) risolvere alcuni tipi di problemi più velocemente di un computer digitale. Ma sono caduti in disgrazia proprio a causa della mancanza di flessibilità. Nessuno vuole collegare manualmente i circuiti con amplificatori operazionali e comparatori per risolvere y .

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.