Libro da leggere prima di Elements of Statistical Learning?


50

Sulla base di questo post , desidero digerire Elements of Statistical Learning. Fortunatamente è disponibile gratuitamente e ho iniziato a leggerlo.

Non ho abbastanza conoscenze per capirlo. Puoi consigliarmi un libro che è una migliore introduzione agli argomenti del libro? Eventualmente qualcosa che mi darà le conoscenze necessarie per capirlo?

Relazionato:

Un solido background in matematica è un requisito totale per ML?


12
Ho trovato l'algebra lineare di Strang e le sue applicazioni estremamente utili per comprendere le manipolazioni della matrice che formano gran parte degli elementi.
richiemorrisroe,

Risposte:


18

Ho comprato, ma non ho ancora letto,

S. Marsland, Machine Learning: An Algorithmic Perspective , Chapman & Hall, 2009.

Tuttavia, le recensioni sono favorevoli e affermano che è più adatto per i principianti rispetto ad altri libri ML che hanno più profondità. Scorrendo le pagine, mi sembra buono per me perché ho poco background in matematica.


Sembra fantastico - molto accessibile.
B Sette,

Ho scaricato e letto il "campione" - tutte le 19 pagine (wow). È molto più facile da capire rispetto a The Elements of Statistical Learning. Sicuramente sembra essere quello che sto cercando. Grazie.
B Sette,

4
Ho apportato modifiche alla tua domanda per fornire una citazione per il libro. In generale, mettere le cose come "Mi piace questo " in una risposta è scoraggiato dal momento che in caso di rottura di collegamento, nessuno saprà che cosa "questo" si riferiva. Saluti.
cardinale il

Ho appena preso questo e ho iniziato a leggerlo (prime 75 pagine). È fantastico. Molto facile da capire, ma abbastanza dettagliato da essere pratico e utile. Altamente raccomandato a chiunque voglia usare Machine Learning. Esattamente quello che stavo cercando. Grazie!
B Seven

39

Gli autori di Elements of Statistical Learning sono usciti con un nuovo libro (agosto 2013) rivolto a utenti senza un pesante background matematico. Un'introduzione all'apprendimento statistico: con applicazioni in R

La versione PDF gratuita di questo libro è attualmente disponibile qui .


Lo stavo per suggerire sin dalla sua recente pubblicazione ed è ovviamente fortemente correlato al testo obiettivo del poster. Buona raccomandazione
Chris Simokat,

3
Meglio ancora, gli autori hanno annunciato che un pdf online gratuito di questo libro sarà disponibile da gennaio 2013 (viene utilizzato in un MOOC che stanno eseguendo.)
Flounderer

16

Ho trovato Programming Collective Intelligence il libro più semplice per i principianti, poiché l'autore Toby Segaran è focalizzato nel consentire allo sviluppatore di software mediano di sporcarsi le mani con l'hacking dei dati il ​​più velocemente possibile.

Capitolo tipico: Il problema dei dati è chiaramente descritto, seguito da una spiegazione approssimativa di come funziona l'algoritmo e infine mostra come creare alcune intuizioni con poche righe di codice.

L'uso di Python consente di capire tutto piuttosto velocemente (non è necessario conoscere Python, sul serio, non lo sapevo prima). NON pensare che questo libro si concentri solo sulla creazione di un sistema di raccomandazione. Si occupa anche di estrazione del testo / filtro antispam / ottimizzazione / clustering / convalida ecc. E quindi offre una panoramica accurata degli strumenti di base di ogni minatore di dati.

Il capitolo 10 tratta anche dei dati del mercato azionario, ma l'attenzione non si concentra sul data mining delle serie temporali. Forse l'unico inconveniente (per te) di questo eccellente libro.


È disponibile su Safari Books Online safaribooksonline.com . Grazie.
B Sette,

1
Ho preso questo libro e ho iniziato a lavorarci su. È molto pratico. Nelle prime 18 pagine si implementa un motore di raccomandazione completo (di base).
B Sette,

Caspita, questo libro è davvero incredibile. Ti insegna come implementare tutti i tipi di algoritmi di Machine Learning con solo un po 'di codice Python. Uno dei libri più pratici di sempre. L'unico inconveniente è che Python è stato aggiornato da quando il libro è stato pubblicato. Utilizza anche molte API che sono state modificate. Quindi non credo che gli esempi funzioneranno senza alcune modifiche.
B Seven

@BSeven grazie, non lo sapevo. Non sono sicuro se preferisco un libro che utilizza librerie preesistenti (che in genere è una cosa da non perdere) o il suo codice (che funziona per tutti gli esempi di libri ma potrebbe essere meno robusto a causa di un minor numero di utenti).
Steffen,

1
Penso che oggigiorno l'unica scelta siano le librerie preesistenti. Sono onnipresenti, facili da integrare, multipiattaforma, multilingue e veloci. Oltre a ciò, se un libro ha un suo codice, è molto più difficile da modificare. È più semplice modificare le chiamate a una libreria. Grazie per la raccomandazione È una grande risorsa.
B Seven

13

Introduzione all'apprendimento automatico , di E. Alpaydin (MIT Press, 2010, 2a ed.), Tratta molti argomenti con belle illustrazioni (molto simili a Bishop's Pattern Recognition e Machine Learning ).

Inoltre, Andrew W. Moore ha dei simpatici tutorial sull'estrazione di dati statistici .


(+1) Non conosco il libro, ma i tutorial di Andrew Moore sono fantastici (e persino divertenti a volte)
steffen,

@steffen Consiglierei anche i metodi statistici di Radford Neale per l'apprendimento automatico e il data mining .
chl

1
+1 Alpaydin è la strada giusta da percorrere. Ero nella stessa identica situazione dell'OP alcuni mesi fa. Lottando male con Tibshirani, e poi mi sono imbattuto in Alpaydin e da allora le cose sono andate molto meglio. Alla fine però penso che Tibshirani sia assolutamente da leggere.
Andy,

10

Tutte le statistiche di Mayhaps Wasserman sarebbero di interesse. Puoi campionare il libro dal link indicato - e solo i primi paragrafi della prefazione fanno una vendita difficile al tuo mercato - e probabilmente puoi scaricare il libro gratuitamente tramite Springer se sei associato a un'università.

EDIT: Oops, non ho notato quanto fosse antico questo thread.


5
Non importa, la raccomandazione è ancora utile per tutti gli altri che leggono il thread (come me; o).
Dikran Marsupial,

1
Ottimo libro, ma in tutta onestà, se si può leggere e comprendere tutta la statistica , una buona parte dell'ESL è ridondante.
usεr11852 dice Reinstate Monic il

7

Gli elementi dell'apprendimento statistico potrebbero essere una lettura difficile, soprattutto per un autodidatta. Durante la ricerca di alcune spiegazioni sul secondo capitolo mi sono imbattuto nella seguente risorsa: https://waxworksmath.com/Authors/G_M/Hastie/WriteUp/Weatherwax_Epstein_Hastie_Solution_Manual.pdf . Contiene oltre 100 pagine di annotazioni e spiegazioni che chiariscono alcuni momenti complicati del libro. Una grande risorsa per tutti coloro che leggono questo libro. Questo testo complementare include soluzioni per esercizi.


5

Consiglio vivamente A First Course in Machine Learning di Rogers e Girolami. Copre le idee chiave in un ordine molto logico, con buoni esempi e con il minimo livello di matematica per avere una base adeguata nei fondamenti. Non ha l'ampiezza della copertura di alcuni libri, ma è esattamente per questo che è così buono come un testo introduttivo.


Sembra un buon primo libro. E c'è una versione Kindle.
B Seven,

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.