Quali sono i prerequisiti matematici per comprendere la parte centrale degli algoritmi nell'intelligenza artificiale e sviluppare il proprio algoritmo?
Per favore, riferiscimi i libri specifici.
Quali sono i prerequisiti matematici per comprendere la parte centrale degli algoritmi nell'intelligenza artificiale e sviluppare il proprio algoritmo?
Per favore, riferiscimi i libri specifici.
Risposte:
Good Mathematics Foundation
Inizia assicurando la piena competenza con l'algebra intermedia e alcune altre basi di calcolo e matematica discreta, compresa la terminologia e i concetti di base in questi argomenti.
Fondamenti della cibernetica
Norbert Wiener, Cybernetics, 1948, MIT Press, contiene serie temporali e concetti di feedback con una chiarezza e un comando non visibili nelle opere successive; contiene anche un'introduzione alla teoria dell'informazione che inizia con la formula log 2 di Shannon per definire la quantità di informazioni in un po '. Questo è importante per comprendere l'espansione del concetto di entropia dell'informazione.
Calcolo
Trova un buon libro di calcolo e assicurati di avere chiarezza sulla teoria chiave e l'applicazione in queste categorie.
Gran parte di questo è in Calculus , Strang, MIT, Wellesley-Cambridge Press . Sebbene il PDF sia disponibile sul Web, è di base e non particolarmente profondo. Quello nella biblioteca del nostro laboratorio è Intermediate Calculus , Hurley, Holt Rinehart & Winston, 1980 . È completo e in qualche modo meglio strutturato rispetto a quello che ho nella mia biblioteca di casa, che Princeton usa per i secondo anno.
Assicurati di lavorare comodamente in spazi oltre spaces 2 (oltre 2D). Ad esempio, gli RNN si trovano spesso in spazi come ℝ 4 thorugh ℝ 7 a causa delle dimensioni orizzontale, verticale, profondità dei pixel e dei fotogrammi del filmato.
Matematica finita
È un peccato che nessuna combinazione di tre libri a cui riesco a pensare abbia tutti questi.
Chimica e neurologia
È bene ricordare gli equilibri chimici dalla chimica delle scuole superiori. L'equilibrio gioca un ruolo chiave in progetti AI più sofisticati. Comprendere la relazione simbiotica tra modelli generativi e discriminatori nei GAN aiuterà uno studente a migliorare questa comprensione.
Le funzioni di controllo all'interno dei sistemi biologici rimangono una fonte primaria di prove del concetto nella ricerca dell'intelligenza artificiale. Man mano che i ricercatori diventano più creativi nell'immaginare forme di adattamento che non imitano direttamente alcuni aspetti della biologia (ancora lontana da questa scrittura) la creatività può giocare un ruolo più ampio nella formulazione degli obiettivi della ricerca sull'IA.
Anche così, l'IA rimarrà probabilmente un campo ampiamente interdisciplinare.
Lavoro come professore e recentemente ho progettato i requisiti matematici per un nuovo specialista in IA, in consultazione con molti dei miei colleghi di altre istituzioni.
Le altre risposte, in particolare quelle di FauChrisian, fanno un buon lavoro nel catalogare tutti gli argomenti specifici che potrebbero essere utili da qualche parte nell'IA, ma non tutti sono ugualmente utili per comprendere gli argomenti chiave. In altri casi, la comprensione dell'argomento è essenzialmente la stessa della comprensione dei relativi algoritmi AI, quindi di solito li insegniamo insieme invece di assumere la conoscenza dei prerequisiti. Ad esempio, i processi decisionali di Markov non sono difficili da insegnare a qualcuno che già conosce le basi della teoria dei grafi e delle probabilità, quindi di solito li copriamo solo quando insegniamo l'apprendimento per rinforzo in un corso di AI, piuttosto che come argomento separato in una matematica corso.
I requisiti matematici su cui ci siamo stabiliti sembrano:
Un corso di uno o due semestri in matematica discreta. Questo è tanto per confortare con prove e rigore matematico quanto con qualsiasi argomento specifico nell'area. Si tratta principalmente di conoscenze "di base", ma alcune parti risultano molto utili. Comfort con infinite sommazioni, le basi di grafici, combinatoria e analisi asintotica sono forse le parti più direttamente applicabili. Mi piace il libro di Susanna Epp .
Un corso di uno o due semestri di algebra lineare, utile in un'ampia varietà di argomenti di intelligenza artificiale, in particolare apprendimento automatico e data mining. Lay & Lay è un libro a posto, ma probabilmente non è il migliore in assoluto. Shilov è una raccomandazione di Ian Goodfellow e altri, ma non l'ho provato da solo.
Un corso in probabilità, e forse un corso moderno in statistica (cioè con un focus bayesiano). Un vecchio corso di statistica, o uno rivolto agli scienziati sociali, non è tuttavia molto utile. I miei colleghi statistici stanno usando Lock5 in questo momento e stanno avendo buone esperienze con esso.
Almeno calcolo differenziale e integrale, e preferibilmente almeno derivate parziali nel calcolo vettoriale, ma forse l'intero corso. Ciò è utile per l'ottimizzazione, l'apprendimento automatico e gli approcci basati sull'economia all'IA. Stewart è il libro di testo più comune. È completo e può essere utilizzato per tutti e tre i corsi, ma le sue spiegazioni non sono sempre le migliori. Lo consiglierei comunque comunque.
Questi sono gli argomenti chiave. Se non hai anche un background tradizionale nella programmazione, un corso di teoria dei grafi e le basi della complessità asintotica o la progettazione e l'analisi dell'algoritmo potrebbero essere buoni integratori. Di solito, tuttavia, gli AI provengono da un background informatico standard, che copre molto bene tutte queste cose.
Per quanto riguarda semplici algoritmi come Gradient Descent, è necessario avere una buona conoscenza dei derivati parziali. Soprattutto se si desidera implementare reti neurali. Inoltre, la maggior parte degli algoritmi è vettorializzata per migliorare la velocità di elaborazione e quindi è necessario essere a proprio agio con la matematica matriciale. Ciò implica essere veramente rapidi e comodi con dimensioni delle matrici, dimensioni dei prodotti, moltiplicazione delle matrici, trasposizione e così via. Molto raramente, è possibile utilizzare il calcolo matriciale per arrivare direttamente a soluzioni ottimali, quindi alcuni risultati di quest'area dovrebbero fare. Andando avanti, è necessario comprendere alcune analisi delle funzioni. questo è necessario per avere un'intuizione su cosa sta facendo l'attivazione come sigmoid e tanh, log. Una presa di probabilità e aspettative è anche molto utile. Dovresti anche essere chiaro con i vettori ortogonali e i prodotti interni.
Detto questo, ti suggerirei di cogliere le operazioni di calcolo e matrice di base e provare ad apprendere i concetti di intelligenza artificiale. Se non riesci a capire qualcosa, esplora la matematica.
Nota: ancora una volta questo è solo per l'avvio.