Foundations of Machine Learning , di Mehryar Mohri, Afshin Rostamizadeh e Ameet Talwalkar, è un libro del 2012 sulla teoria dell'apprendimento automatico.
Comprensione dell'apprendimento automatico: dalla teoria agli algoritmi , di Shai Shalev-Shwartz e Shai Ben-David, è un libro simile del 2014 che è abbastanza noto e mirato un po 'più introduttivo di Mohri / Rostamizadeh / Talwalkar, ma ha ancora molta teoria in esso. È disponibile gratuitamente online.
Neural Network Learning: Theoretical Foundations , di Martin Anthony e Peter Bartlett, è un libro del 1999 sulla teoria della ML definito come relativo alle reti neurali, ma (a mia impressione non averlo letto) riguarda principalmente la teoria della ML in generale.
Questi tre libri assumono principalmente il punto di vista predominante della teoria dell'apprendimento statistico. C'è anche un punto di vista interessante chiamato teoria dell'apprendimento computazionale , ispirato più dalla teoria dell'informatica. Penso che il libro introduttivo standard in quest'area sia un'introduzione alla teoria dell'apprendimento computazionale , un libro del 1994 di Michael Kearns e Umesh Vazirani.
Un altro eccellente e spesso raccomandato libro disponibile gratuitamente è Trevor Hastie, Robert Tibshirani e la seconda edizione del 2009 di The Elements of Statistical Learning . È forse un po 'meno teorico degli altri, e più dal punto di vista dello statistico che dell'apprendente della macchina, ma ha ancora molto interesse.
Inoltre, se ti interessa in particolare la discesa del gradiente, il riferimento standard è Convex Optimization di Stephen Boyd e Lieven Vandenberghe. Questo libro del 2004 è disponibile gratuitamente online.
Nessuno di questi libri contiene molto sulla teoria moderna delle reti profonde, se è questo che ti interessa. (Ad esempio, la maggior parte della teoria dell'ottimizzazione riguarderà casi convessi, che le reti profonde decisamente non lo sono.) Questo perché questa teoria è molto nuova; la maggior parte dei risultati sono arrivati solo negli ultimi anni ed è ancora in fase di definizione. Ma, come una panoramica della comprensione di base del campo finora, nessuno di loro ti preparerà per comprendere i documenti in cui viene svolto quel lavoro (tranne forse Kearns / Vazirani, che si concentra su diversi aspetti dell'analisi che io ' Non sono sicuro che siano stati applicati con successo a reti profonde - ancora).