Libro di testo sulla * teoria * delle reti neurali / algoritmi ML?

23

Ogni libro di testo che ho visto finora descrive algoritmi ML e come implementarli.

Esiste anche un libro di testo che costruisce teoremi e prove per il comportamento di quegli algoritmi? es. affermando che nelle condizioni , la discesa del gradiente porterà sempre ad ? $x,y,z$ $A,B,C$

— user56834
fonte

1

Ci sono un paio di suggerimenti alla mia domanda qui . In particolare, potresti apprezzare il libro che raccomando nella mia risposta.

— Jack M

Molti libri di testo di ottimizzazione forniscono prove di convergenza per algoritmi di ottimizzazione. (Dobbiamo verificare attentamente che le ipotesi di questi teoremi di convergenza siano soddisfatte prima di trarre qualsiasi conclusione certa che il nostro algoritmo è garantito per convergere.)

— littleO

16

Foundations of Machine Learning , di Mehryar Mohri, Afshin Rostamizadeh e Ameet Talwalkar, è un libro del 2012 sulla teoria dell'apprendimento automatico.

Comprensione dell'apprendimento automatico: dalla teoria agli algoritmi , di Shai Shalev-Shwartz e Shai Ben-David, è un libro simile del 2014 che è abbastanza noto e mirato un po 'più introduttivo di Mohri / Rostamizadeh / Talwalkar, ma ha ancora molta teoria in esso. È disponibile gratuitamente online.

Neural Network Learning: Theoretical Foundations , di Martin Anthony e Peter Bartlett, è un libro del 1999 sulla teoria della ML definito come relativo alle reti neurali, ma (a mia impressione non averlo letto) riguarda principalmente la teoria della ML in generale.

Questi tre libri assumono principalmente il punto di vista predominante della teoria dell'apprendimento statistico. C'è anche un punto di vista interessante chiamato teoria dell'apprendimento computazionale , ispirato più dalla teoria dell'informatica. Penso che il libro introduttivo standard in quest'area sia un'introduzione alla teoria dell'apprendimento computazionale , un libro del 1994 di Michael Kearns e Umesh Vazirani.

Un altro eccellente e spesso raccomandato libro disponibile gratuitamente è Trevor Hastie, Robert Tibshirani e la seconda edizione del 2009 di The Elements of Statistical Learning . È forse un po 'meno teorico degli altri, e più dal punto di vista dello statistico che dell'apprendente della macchina, ma ha ancora molto interesse.

Inoltre, se ti interessa in particolare la discesa del gradiente, il riferimento standard è Convex Optimization di Stephen Boyd e Lieven Vandenberghe. Questo libro del 2004 è disponibile gratuitamente online.

Nessuno di questi libri contiene molto sulla teoria moderna delle reti profonde, se è questo che ti interessa. (Ad esempio, la maggior parte della teoria dell'ottimizzazione riguarderà casi convessi, che le reti profonde decisamente non lo sono.) Questo perché questa teoria è molto nuova; la maggior parte dei risultati sono arrivati solo negli ultimi anni ed è ancora in fase di definizione. Ma, come una panoramica della comprensione di base del campo finora, nessuno di loro ti preparerà per comprendere i documenti in cui viene svolto quel lavoro (tranne forse Kearns / Vazirani, che si concentra su diversi aspetti dell'analisi che io ' Non sono sicuro che siano stati applicati con successo a reti profonde - ancora).

— Dougal
fonte

La comprensione dell'apprendimento automatico è disponibile online dalla pagina Web di un autore.

— Jakub Bartczuk,

2

Apprendimento automatico: una prospettiva probabilistica di Kevin P. Murphy spiega molta teoria dal punto di vista bayesiano (l'ho usato solo per la regressione logistica, ma ho pensato che fosse abbastanza buono). L'intero libro è disponibile online come PDF cercando su Google.

— QWR
fonte

2

Deep Learning (serie di calcolo adattivo e apprendimento automatico) . Questo è scritto da Ian Goodfellow, Yoshua Bengio, Aaron Courville . Secondo l'accordo dell'autore con MIT Press, è possibile leggere la copia legalmente gratuita disponibile sul browser in questo sito Web. www.deeplearningbook.org Questo è utile per la pura matematica e teoria della rete neurale e dei suoi diversi rami secondari.

In aggiunta a questo,

Gli elementi dell'apprendimento statistico: data mining, inferenza e previsione sono anche un buon libro per costruire basi teoriche e matematiche nell'apprendimento automatico tradizionale. Questo è scritto da Trevor Hastie, Robert Tibshirani e Jerome Friedman e disponibile gratuitamente dagli autori su https://web.stanford.edu/~hastie/ElemStatLearn/

— Appassionato
fonte

1

Neural Network Design (Martin T. Hagan, Howard B. Demuth, Mark Hudson Beale, Orlando De Jesús) ha una bella discussione sull'ottimizzazione nel contesto delle reti neurali.

— Sycorax dice Reinstate Monica
fonte