Quali libri offrono una panoramica delle statistiche computazionali in quanto si applicano all'informatica?


15

Come ingegnere del software, sono interessato ad argomenti come algoritmi statistici, data mining, machine learning, reti bayesiane, algoritmi di classificazione, reti neurali, catene di Markov, metodi Monte Carlo e generazione casuale di numeri.

Personalmente non ho avuto il piacere di lavorare direttamente con nessuna di queste tecniche, ma ho dovuto lavorare con un software che, sotto il cofano, le impiegava e mi piacerebbe saperne di più su di esse, ad alto livello. Sto cercando libri che coprano una grande ampiezza - a questo punto non è necessaria una grande profondità. Penso di poter imparare molto sullo sviluppo del software se riesco a capire le basi matematiche alla base degli algoritmi e delle tecniche utilizzate.

La comunità di analisi statistica può raccomandare libri che posso usare per saperne di più sull'implementazione di vari elementi statistici nel software?

Risposte:




3

Ecco un bel libro di James E. Gentle, Computational Statistics (Springer, 2009), che copre sia gli aspetti computazionali che statistici dell'analisi dei dati. Gentle ha anche scritto altri grandi libri, controlla le sue pubblicazioni.

Un altro grande libro è il Manuale di statistica computazionale , di Gentle et al. (Springer, 2004); sta circolando come PDF da qualche parte sul Web, quindi prova a guardarlo su Google.



1

Ho preso una copia di Probability and Statistics for Computer Scientists - Michael Baron in vendita con un altro libro di statistiche (l'ho onestamente comprato a causa del nome - volevo un libro che avrebbe preso una sorta di sguardo alle statistiche dal punto di vista dell'informatica, anche se non era perfetto). Non ho ancora avuto la possibilità di leggerlo o risolvere eventuali problemi, ma sembra un libro solido.

La prefazione del libro dice che è per studenti universitari di livello superiore e neolaureati, e sarei d'accordo con questo. È necessaria una certa comprensione della probabilità e delle statistiche per comprendere i contenuti di questo libro.

Gli argomenti includono probabilità, variabili casuali discrete, distribuzioni continue, metodi Monte Carlo, processi stocastici, sistemi di accodamento, inferenza statistica e regressione.


1

Sebbene non si tratti di statistiche computazionali specifiche, un manuale di analisi statistiche che utilizzano R - Brian S. Everitt e Torsten Hothorn tratta molti argomenti che ho visto trattati in libri statistici di base e intermedi: inferenza, ANOVA, regressione lineare, regressione logistica, stima della densità, partizionamento ricorsivo, analisi dei componenti principali e analisi dei cluster - usando il linguaggio R. Questo potrebbe essere di interesse per coloro che sono interessati alla programmazione.

Tuttavia, a differenza di altri libri, l'enfasi è sull'uso del linguaggio R per svolgere queste funzioni statistiche. Altri libri che ho visto usano combinazioni di algebra e calcolo per dimostrare le statistiche. Questo libro in realtà si concentra su come analizzare i dati usando il linguaggio R. E per renderlo ancora più utile, i set di dati utilizzati dagli autori sono in CRAN, il repository R.


1

Calcolo statistico con R - Maria L. Rizzo copre molti argomenti in Probabilità e statistiche per gli informatici: probabilità e statistiche di base, variabili casuali, statistiche bayesiane, catene di Markov, visualizzazione di dati multivariati, metodi Monte Carlo, test di permutazione, probabilità stima della densità e metodi numerici.

Le equazioni e le formule utilizzate sono presentate sia come formule matematiche che in codice R. Direi che una conoscenza di base di probabilità, statistica, calcolo e forse matematica discreta sarebbe consigliabile per chiunque voglia leggere questo libro. Un background di programmazione sarebbe utile, ma ci sono alcuni riferimenti per il linguaggio R, gli operatori e la sintassi.


1

Come ingegnere informatico che arriva all'analisi dei dati, un libro davvero leggibile che copre le cose da una prospettiva piuttosto non intimidatoria e leggibile (al costo di non coprire tanto quanto uno qualsiasi degli altri libri qui suggeriti) è stata la programmazione dell'intelligenza collettiva di Toby Segaran. L'ho trovato molto più accessibile rispetto, ad esempio, al libro di Bishop, che è un ottimo riferimento ma approfondisce ciò che probabilmente vorrai al primo passaggio. Su Amazon: http://www.amazon.com/Programming-Collective-Intelligence-Building-Applications/dp/0596529325


1

CRAN ha diversi buoni esempi di libri relativi alla programmazione statistica. Alcuni di questi non riguarderanno l'apprendimento automatico e MCMC, ma ogni voce è annotata, quindi dovresti avere un'idea approssimativa di ciò che ogni libro contiene per approfondire ulteriormente. http://www.r-project.org/doc/bib/R-books.html

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.