Quali sono i prerequisiti matematici per un ricercatore di intelligenza artificiale?


12

Quali sono i prerequisiti matematici per comprendere la parte centrale degli algoritmi nell'intelligenza artificiale e sviluppare il proprio algoritmo?

Per favore, riferiscimi i libri specifici.

Risposte:


9

Good Mathematics Foundation

Inizia assicurando la piena competenza con l'algebra intermedia e alcune altre basi di calcolo e matematica discreta, compresa la terminologia e i concetti di base in questi argomenti.

  • Serie infinita
  • Prove logiche
  • Algebra e matrici lineari
  • Geometria analitica, in particolare la distinzione tra estremi locali e globali (minimi e massimi), punti di sella e punti di flesso
  • Insiemistica
  • Probabilità
  • statistica

Fondamenti della cibernetica

Norbert Wiener, Cybernetics, 1948, MIT Press, contiene serie temporali e concetti di feedback con una chiarezza e un comando non visibili nelle opere successive; contiene anche un'introduzione alla teoria dell'informazione che inizia con la formula log 2 di Shannon per definire la quantità di informazioni in un po '. Questo è importante per comprendere l'espansione del concetto di entropia dell'informazione.

Calcolo

Trova un buon libro di calcolo e assicurati di avere chiarezza sulla teoria chiave e l'applicazione in queste categorie.

  • Serie storiche
  • Serie infinita
  • Convergenza - Le reti artificiali convergono idealmente in un ottimale durante l'apprendimento.
  • Differenziali parziali
  • Matrici giacobine e dell'Assia
  • Matematica multivariata
  • Regioni di confine
  • Matematica discreta

Gran parte di questo è in Calculus , Strang, MIT, Wellesley-Cambridge Press . Sebbene il PDF sia disponibile sul Web, è di base e non particolarmente profondo. Quello nella biblioteca del nostro laboratorio è Intermediate Calculus , Hurley, Holt Rinehart & Winston, 1980 . È completo e in qualche modo meglio strutturato rispetto a quello che ho nella mia biblioteca di casa, che Princeton usa per i secondo anno.

Assicurati di lavorare comodamente in spazi oltre spaces 2 (oltre 2D). Ad esempio, gli RNN si trovano spesso in spazi come ℝ 4 thorugh ℝ 7 a causa delle dimensioni orizzontale, verticale, profondità dei pixel e dei fotogrammi del filmato.

Matematica finita

È un peccato che nessuna combinazione di tre libri a cui riesco a pensare abbia tutti questi.

  • Grafici diretti - Impara PRIMA di alberi o circuiti (reti artificiali) perché è la topografia superset di tutte quelle configurazioni
  • Alberi di simboli astratti (AST)
  • Teoria avanzata degli insiemi
  • Alberi decisionali
  • Catene di Markov
  • Teoria del caos (in particolare la differenza tra casuale e pseudo-casuale)
  • La teoria dei giochi inizia con Von Neumann e la teoria dei giochi di Morgenstern , il lavoro fondamentale in quel campo
  • Convergenza in sistemi discreti, in particolare l'applicazione della teoria per segnalare la saturazione in aritmetica a numero intero, a punto fisso o a virgola mobile
  • Mezzi statistici, deviazioni, correlazione e concetti più progressivi di entropia, entropia relativa ed entropia incrociata
  • Raccordo curva
  • circonvoluzione
  • Probabilità in particolare il teorema di Bayes
  • Teoria algoritmica (teoremi di incertezza di Gödel e completezza di Turing)

Chimica e neurologia

È bene ricordare gli equilibri chimici dalla chimica delle scuole superiori. L'equilibrio gioca un ruolo chiave in progetti AI più sofisticati. Comprendere la relazione simbiotica tra modelli generativi e discriminatori nei GAN aiuterà uno studente a migliorare questa comprensione.

Le funzioni di controllo all'interno dei sistemi biologici rimangono una fonte primaria di prove del concetto nella ricerca dell'intelligenza artificiale. Man mano che i ricercatori diventano più creativi nell'immaginare forme di adattamento che non imitano direttamente alcuni aspetti della biologia (ancora lontana da questa scrittura) la creatività può giocare un ruolo più ampio nella formulazione degli obiettivi della ricerca sull'IA.

Anche così, l'IA rimarrà probabilmente un campo ampiamente interdisciplinare.


2
Alcuni commenti: 1) Sono d'accordo con ciò che John ha scritto nella sua risposta, che la sua risposta riguarda un "nucleo" più generale, mentre la tua include cose che potrebbero essere utili o che potrebbero non dipendere dall'area dell'intelligenza artificiale in cui si trova qualcuno. 2) Molte cose che descrivi in ​​"matematica del liceo" non sono (necessariamente) matematica del liceo, almeno non in Europa (non so degli Stati Uniti). In Olanda, non ho avuto nessuna algebra lineare, matrici, serie infinite o teoria degli insiemi fino al mio primo anno all'università. Alcuni di loro potrebbero essere apparsi prima se avessi scelto una serie diversa di corsi al liceo.
Dennis Soemers,

2
3) Analisi funzionale / Teoria delle misure può essere utile includere in alcune aree. Ma, ancora una volta, dipende molto da quanto vuoi approfondire come ricercatore di intelligenza artificiale. Alcuni ricercatori di intelligenza artificiale sul lato più teorico delle cose troveranno utili quasi tutte queste cose. Altri ricercatori di intelligenza artificiale più dal punto di vista empirico / software / di programmazione hanno bisogno di molto, molto meno. Entrambi possono ancora produrre ricerche di grande valore.
Dennis Soemers,

7

Lavoro come professore e recentemente ho progettato i requisiti matematici per un nuovo specialista in IA, in consultazione con molti dei miei colleghi di altre istituzioni.

Le altre risposte, in particolare quelle di FauChrisian, fanno un buon lavoro nel catalogare tutti gli argomenti specifici che potrebbero essere utili da qualche parte nell'IA, ma non tutti sono ugualmente utili per comprendere gli argomenti chiave. In altri casi, la comprensione dell'argomento è essenzialmente la stessa della comprensione dei relativi algoritmi AI, quindi di solito li insegniamo insieme invece di assumere la conoscenza dei prerequisiti. Ad esempio, i processi decisionali di Markov non sono difficili da insegnare a qualcuno che già conosce le basi della teoria dei grafi e delle probabilità, quindi di solito li copriamo solo quando insegniamo l'apprendimento per rinforzo in un corso di AI, piuttosto che come argomento separato in una matematica corso.

I requisiti matematici su cui ci siamo stabiliti sembrano:

  • Un corso di uno o due semestri in matematica discreta. Questo è tanto per confortare con prove e rigore matematico quanto con qualsiasi argomento specifico nell'area. Si tratta principalmente di conoscenze "di base", ma alcune parti risultano molto utili. Comfort con infinite sommazioni, le basi di grafici, combinatoria e analisi asintotica sono forse le parti più direttamente applicabili. Mi piace il libro di Susanna Epp .

    • Un corso di uno o due semestri di algebra lineare, utile in un'ampia varietà di argomenti di intelligenza artificiale, in particolare apprendimento automatico e data mining. Lay & Lay è un libro a posto, ma probabilmente non è il migliore in assoluto. Shilov è una raccomandazione di Ian Goodfellow e altri, ma non l'ho provato da solo.

    • Un corso in probabilità, e forse un corso moderno in statistica (cioè con un focus bayesiano). Un vecchio corso di statistica, o uno rivolto agli scienziati sociali, non è tuttavia molto utile. I miei colleghi statistici stanno usando Lock5 in questo momento e stanno avendo buone esperienze con esso.

    • Almeno calcolo differenziale e integrale, e preferibilmente almeno derivate parziali nel calcolo vettoriale, ma forse l'intero corso. Ciò è utile per l'ottimizzazione, l'apprendimento automatico e gli approcci basati sull'economia all'IA. Stewart è il libro di testo più comune. È completo e può essere utilizzato per tutti e tre i corsi, ma le sue spiegazioni non sono sempre le migliori. Lo consiglierei comunque comunque.

Questi sono gli argomenti chiave. Se non hai anche un background tradizionale nella programmazione, un corso di teoria dei grafi e le basi della complessità asintotica o la progettazione e l'analisi dell'algoritmo potrebbero essere buoni integratori. Di solito, tuttavia, gli AI provengono da un background informatico standard, che copre molto bene tutte queste cose.


1
@FauChristian Penso che abbiamo elencato gli stessi argomenti: Calcolo e matematica finita di sicuro. Pensiamo entrambi che dovresti prendere un paio di lezioni in ciascuno. Ho elencato statistiche e probabilità. Penso che se vuoi fare un lavoro moderno nell'intelligenza artificiale, non andrai lontano senza questo. Hai elencato chimica e neuroscienze. Penso che pochi AI penserebbero a questi argomenti come argomenti necessari. Certamente, puoi superare Russell e Norvig senza di essa. Se vuoi lavorare nella neuroscienza computazionale (non nell'apprendimento profondo), potrebbe essere utile però. Dubito anche che tu abbia bisogno di 16 anni per contribuire. 5-6 di sicuro però.
John Doucette

1
@FauChristian È tutto vero. Tendo a pensare che se volessi fare ricerche nella maggior parte dei moderni laboratori di intelligenza artificiale, avresti comunque bisogno di probabilità (almeno metà del moderno lavoro di intelligenza artificiale è in qualche tipo di apprendimento automatico, e gran parte di questo è in apprendimento profondo) . In genere, gli studenti laureati svolgono attività di ricerca. Molti di loro svolgono attività di ricerca dopo solo 1-2 anni di scuola di specializzazione. In parte è anche abbastanza buono. Queste persone hanno avuto solo 4-6 anni di istruzione formale in materia, al massimo. Più di questo potrebbe renderti più veloce o più profondo, ma il potenziale di ricerca inizia da lì.
John Doucette

3

Per quanto riguarda semplici algoritmi come Gradient Descent, è necessario avere una buona conoscenza dei derivati ​​parziali. Soprattutto se si desidera implementare reti neurali. Inoltre, la maggior parte degli algoritmi è vettorializzata per migliorare la velocità di elaborazione e quindi è necessario essere a proprio agio con la matematica matriciale. Ciò implica essere veramente rapidi e comodi con dimensioni delle matrici, dimensioni dei prodotti, moltiplicazione delle matrici, trasposizione e così via. Molto raramente, è possibile utilizzare il calcolo matriciale per arrivare direttamente a soluzioni ottimali, quindi alcuni risultati di quest'area dovrebbero fare. Andando avanti, è necessario comprendere alcune analisi delle funzioni. questo è necessario per avere un'intuizione su cosa sta facendo l'attivazione come sigmoid e tanh, log. Una presa di probabilità e aspettative è anche molto utile. Dovresti anche essere chiaro con i vettori ortogonali e i prodotti interni.

Detto questo, ti suggerirei di cogliere le operazioni di calcolo e matrice di base e provare ad apprendere i concetti di intelligenza artificiale. Se non riesci a capire qualcosa, esplora la matematica.

Nota: ancora una volta questo è solo per l'avvio.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.