Libro di testo sulla * teoria * delle reti neurali / algoritmi ML?


23

Ogni libro di testo che ho visto finora descrive algoritmi ML e come implementarli.

Esiste anche un libro di testo che costruisce teoremi e prove per il comportamento di quegli algoritmi? es. affermando che nelle condizioni , la discesa del gradiente porterà sempre ad A , B , C ?x,y,zA,B,C


1
Ci sono un paio di suggerimenti alla mia domanda qui . In particolare, potresti apprezzare il libro che raccomando nella mia risposta.
Jack M

Molti libri di testo di ottimizzazione forniscono prove di convergenza per algoritmi di ottimizzazione. (Dobbiamo verificare attentamente che le ipotesi di questi teoremi di convergenza siano soddisfatte prima di trarre qualsiasi conclusione certa che il nostro algoritmo è garantito per convergere.)
littleO

Risposte:


16

Foundations of Machine Learning , di Mehryar Mohri, Afshin Rostamizadeh e Ameet Talwalkar, è un libro del 2012 sulla teoria dell'apprendimento automatico.

Comprensione dell'apprendimento automatico: dalla teoria agli algoritmi , di Shai Shalev-Shwartz e Shai Ben-David, è un libro simile del 2014 che è abbastanza noto e mirato un po 'più introduttivo di Mohri / Rostamizadeh / Talwalkar, ma ha ancora molta teoria in esso. È disponibile gratuitamente online.

Neural Network Learning: Theoretical Foundations , di Martin Anthony e Peter Bartlett, è un libro del 1999 sulla teoria della ML definito come relativo alle reti neurali, ma (a mia impressione non averlo letto) riguarda principalmente la teoria della ML in generale.

Questi tre libri assumono principalmente il punto di vista predominante della teoria dell'apprendimento statistico. C'è anche un punto di vista interessante chiamato teoria dell'apprendimento computazionale , ispirato più dalla teoria dell'informatica. Penso che il libro introduttivo standard in quest'area sia un'introduzione alla teoria dell'apprendimento computazionale , un libro del 1994 di Michael Kearns e Umesh Vazirani.

Un altro eccellente e spesso raccomandato libro disponibile gratuitamente è Trevor Hastie, Robert Tibshirani e la seconda edizione del 2009 di The Elements of Statistical Learning . È forse un po 'meno teorico degli altri, e più dal punto di vista dello statistico che dell'apprendente della macchina, ma ha ancora molto interesse.

Inoltre, se ti interessa in particolare la discesa del gradiente, il riferimento standard è Convex Optimization di Stephen Boyd e Lieven Vandenberghe. Questo libro del 2004 è disponibile gratuitamente online.

Nessuno di questi libri contiene molto sulla teoria moderna delle reti profonde, se è questo che ti interessa. (Ad esempio, la maggior parte della teoria dell'ottimizzazione riguarderà casi convessi, che le reti profonde decisamente non lo sono.) Questo perché questa teoria è molto nuova; la maggior parte dei risultati sono arrivati ​​solo negli ultimi anni ed è ancora in fase di definizione. Ma, come una panoramica della comprensione di base del campo finora, nessuno di loro ti preparerà per comprendere i documenti in cui viene svolto quel lavoro (tranne forse Kearns / Vazirani, che si concentra su diversi aspetti dell'analisi che io ' Non sono sicuro che siano stati applicati con successo a reti profonde - ancora).


La comprensione dell'apprendimento automatico è disponibile online dalla pagina Web di un autore.
Jakub Bartczuk,


2
  • Deep Learning (serie di calcolo adattivo e apprendimento automatico) . Questo è scritto da Ian Goodfellow, Yoshua Bengio, Aaron Courville . Secondo l'accordo dell'autore con MIT Press, è possibile leggere la copia legalmente gratuita disponibile sul browser in questo sito Web. www.deeplearningbook.org Questo è utile per la pura matematica e teoria della rete neurale e dei suoi diversi rami secondari.

In aggiunta a questo,

  • Gli elementi dell'apprendimento statistico: data mining, inferenza e previsione sono anche un buon libro per costruire basi teoriche e matematiche nell'apprendimento automatico tradizionale. Questo è scritto da Trevor Hastie, Robert Tibshirani e Jerome Friedman e disponibile gratuitamente dagli autori su https://web.stanford.edu/~hastie/ElemStatLearn/

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.