Se i neuroni e le sinapsi possono essere implementati usando transistor, cosa ci impedisce di creare reti neurali arbitrariamente grandi usando gli stessi metodi con cui sono realizzate le GPU?
In sostanza, abbiamo visto come funzionano straordinariamente bene le reti neurali virtuali implementate sui processori sequenziali (anche le GPU sono macchine sequenziali, ma con enormi quantità di core).
Si può immaginare che usando i principi di progettazione della GPU - che sono fondamentalmente avere migliaia di unità di elaborazione programmabili che funzionano in parallelo - potremmo rendere molto più semplici le "unità di elaborazione dei neuroni" e mettere milioni o miliardi di quelle NPU in un unico grande chip. Avrebbero avuto la propria memoria (per la memorizzazione dei pesi) e sarebbero stati collegati a poche centinaia di altri neuroni condividendo un autobus. Potrebbero avere una frequenza, ad esempio, di 20 Hz, che consentirebbe loro di condividere un bus dati con molti altri neuroni.
Ovviamente, ci sono alcune sfide di ingegneria elettrica qui, ma mi sembra che tutte le grandi aziende tecnologiche dovrebbero esplorare questo percorso ormai.
Molti ricercatori dell'IA affermano che la superintelligenza arriverà intorno all'anno 2045. Credo che il loro ragionamento sia basato sulla legge di Moore e sul numero di neuroni che siamo in grado di implementare nel software in esecuzione sui computer più veloci che abbiamo.
Ma il fatto è che oggi stiamo producendo chip di silicio con miliardi di transistor su di essi. SPARK M7 ha 10 miliardi di transistor.
Se l'implementazione di un neurone (non programmabile) e alcune centinaia di sinapsi richiedono per esempio 100000 transistor, allora possiamo creare una rete neurale nell'hardware che emula 100000 neuroni.
Se progettiamo un tale chip in modo da poterlo semplicemente ingrandire fisicamente se vogliamo più neuroni, allora mi sembra che reti neurali arbitrariamente grandi siano semplicemente una questione di budget.
Siamo tecnicamente in grado di realizzare, in hardware, reti neurali arbitrariamente grandi con la tecnologia attuale?
Ricorda: NON sto chiedendo se una tale rete sarà davvero molto intelligente. Sto semplicemente chiedendo se possiamo effettivamente realizzare reti neurali arbitrariamente grandi e altamente interconnesse, se decidiamo di pagare Intel per farlo?
L'implicazione è che il giorno in cui alcuni scienziati sono in grado di creare intelligenza generale nel software, possiamo usare le nostre capacità hardware per far crescere questa intelligenza generale a livelli umani e oltre.