Libro per una panoramica ampia e concettuale dei metodi statistici


12

Sono molto interessato al potenziale dell'analisi statistica per la simulazione / previsione / stima della funzione, ecc.

Tuttavia, non ne so molto e le mie conoscenze matematiche sono ancora piuttosto limitate: sono uno studente universitario junior in ingegneria del software.

Sto cercando un libro che mi permetta di iniziare su alcune cose di cui continuo a leggere: regressione lineare e altri tipi di regressione, metodi bayesiani, metodi monte carlo, apprendimento automatico, ecc. Vorrei anche iniziare con R, quindi se c'era un libro che combinava entrambi, sarebbe stato fantastico.

Preferibilmente, vorrei che il libro spiegasse le cose concettualmente e non in troppi dettagli tecnici - vorrei che le statistiche fossero molto intuitive per me, perché capisco che ci sono molte insidie ​​rischiose nelle statistiche.

Sono ovviamente disposto a leggere più libri per migliorare la mia comprensione degli argomenti che ritengo preziosi.

Risposte:


11
  • Forse ti piacerebbe qualcosa come l' analisi dei dati e la grafica usando R: un approccio basato sull'esempio di John Maindonald e W. John Braun

    • Sito Web per il libro
    • Amazon con recensioni assortite
    • Lo consiglio perché il libro spunta alcune delle tue scatole; insegna una piccola R; fornisce una panoramica di una gamma di diverse tecniche di modellazione (ad es. regressione multipla, serie temporali, grafica, modello lineare generalizzato, ecc.) senza entrare in troppi dettagli matematici; è abbastanza applicato.
  • Sono d'accordo con @Greg Snow che potresti stare meglio pensando in termini di lettura di un numero di libri diversi. Per ogni argomento che hai citato (ad es. Statistiche bayesiane, serie storiche, simulazioni, R, apprendimento automatico) ci sono buoni libri dedicati a quel particolare argomento. Potresti voler porre domande separate su quale sarebbe un buon libro dati i tuoi interessi particolari in quell'argomento.

  • Buone opzioni online liberamente disponibili

    • Elements of Statistical Learning è un libro eccellente ed è persino disponibile online gratuitamente. Dal tuo post, ho la sensazione che all'inizio potrebbe essere un po 'più tecnico di quello che vuoi, ma dai un'occhiata e vedi cosa ne pensi. Forse sarai pronto per questo ora; forse più tardi.
    • I modelli e i dati ecologici di Benjamin Bolker in R sono altri buoni. È da una prospettiva ecologica, ma spiega chiaramente la simulazione e l'adattamento del modello da una prospettiva relativamente non tecnica; ed è tutto implementato in R. Puoi vedere tutto il suo codice R sul sito web. Puoi persino vedere i documenti Sweave usati per generare il libro!
    • C'è un buon elenco di documentazione R gratuita su CRAN con alcuni dei documenti che forniscono anche istruzioni più ampie sulle statistiche.

5

Un singolo libro che includesse tutti quegli argomenti sarebbe piuttosto impressionante e probabilmente peserebbe più di te. È come chiedere un singolo libro che insegna la programmazione di base, C, Java, Perl e la progettazione di database avanzati in un unico libro (in realtà probabilmente di più, ma non conosco abbastanza termini generatori di software per aggiungere altri più avanzati) .

La stessa regressione è di solito almeno un corso universitario completo, le statistiche bayesiane richiedono un corso o 2 di teoria prima di seguire il corso bayesiano per comprendere appieno, ecc.

Non esiste una strada facile e veloce per quello che stai cercando di fare. Suggerirei di seguire dei buoni corsi presso la tua università e lavorare da lì.

Ci sono state altre discussioni su buoni libri che è possibile cercare alcune idee.


La ringrazio per la risposta. Tuttavia, non sto cercando di capire tutto su tutto da un libro, ma leggendo dire, 50 pagine sulla regressione mi aiuterebbero sicuramente molto a ottenere almeno una ragionevole comprensione di questo argomento ...
Jérôme Le Chatelier

5

Per una combinazione di R con molti dei metodi che descrivi, oltre al testo di Maindonald e Braun menzionato da @Jeromy Anglim, ti suggerirei di dare un'occhiata a questi due libri di Julian Faraway:

Entrambi hanno introduzioni ragionevolmente semplici ai vari argomenti, quest'ultimo copre una vasta gamma di approcci più moderni alla regressione, incluse molte tecniche di apprendimento automatico, ma lo fa a un ritmo più veloce con meno descrizione ed entrambi esemplificano le tecniche tramite il codice R.

Puoi ottenere un codice dalla sezione Libri del sito Web R per ottenere uno sconto del 20% sul prezzo di vendita consigliato se acquisti direttamente da Chapman & Hall / CRC Press, ma controlla il prezzo di Amazon o simili per la tua regione poiché spesso la riduzione su Amazon è competitiva con quello del prezzo dell'editore dopo lo sconto.

Una delle cose positive di questa coppia di libri è che ti danno un buon sapore dei metodi moderni con abbastanza dettagli per poi esplorare le aree che desideri in modo più dettagliato con testi più specializzati.

Parte del contenuto di questi libri è disponibile in un PDF online di Julian, tramite la sezione Documenti forniti del sito Web R. Ti incoraggio a navigare in quella sezione per vedere se ci sono altri documenti che potrebbero farti iniziare senza dover sborsare denaro. In questa sezione è anche possibile trovare una prima versione del testo trasformata nella prima edizione del testo di Maindonald e Braun.


3

Beh, se si desidera una panoramica della maggior parte dei metodi statistici, e il codice R per loro, non si può sbagliare con Venables e moderna Statistica Applicata di Ripley in S .

È succinto, lucido e ha abbastanza codice R per iniziare praticamente su qualsiasi argomento statistico che ti interessa nominare.

Ho comprato questo libro ed ero diffidente riguardo al prezzo rispetto al conteggio delle pagine, ma ne è valsa la pena l'investimento. Presumono calcoli e algebra lineare, ma dato che sei un ingegnere, questo non dovrebbe essere un grosso problema.

Anche la loro programmazione S è meravigliosa, ma probabilmente non è quello che stai cercando in questo momento.


2

Gli elementi dell'apprendimento statistico possono essere poco intimidatori per i principianti. Consiglierei di leggere " Introduzione all'apprendimento statistico con applicazioni in R ", che può essere scaricato gratuitamente da qui -> http://www-bcf.usc.edu/~gareth/ISL/ Ha anche elaborato esempi in R alla fine di ogni capitolo.

" Machine Learning: una prospettiva algoritmica " di Stephen Marsland copre anche una più ampia gamma di argomenti senza andare troppo in matematica.


1

Le risposte precedenti hanno molto sul lato dell'applicazione. Per quanto riguarda il materiale concettuale e il buon pensiero statistico, raccomanderei la teoria della probabilità: la logica della scienza di Edwin Jaynes. I primi tre capitoli sono disponibili gratuitamente qui

Tuttavia, non ha molto a che fare con i programmi per computer, quindi il lato dell'applicazione è quello dei problemi più stilizzati. Ha un brillante capitolo sui paradossi della teoria della probabilità, con una sola eccezione, il "paradosso dell'emarginazione", che qui viene correttamente risolto (anche se Jaynes essenzialmente "prende la lezione" in quanto un precedente improprio dovrebbe essere un limite di una sequenza di priori propri) .


2
Ho adorato questo libro da solo, ma non sono sicuro che sia il posto giusto per iniziare a provare a intuire le statistiche. È un testo piuttosto polemico e idiosincratico.
Ben Lauderdale,

1

I suggerimenti finora formulati sono tutti eccellenti, ma si concentrano sulle tecniche più avanzate e sofisticate che utilizzano il software R. Per una panoramica eccellente e intuitiva delle tecniche multivariate classiche, il quadro di base per gli approcci più aggiornati, tra cui regressione, ANOVA, analisi dei fattori, analisi dei cluster, analisi discriminante, analisi della tabella di contingenza e analisi delle equazioni strutturali, multivariato di Dillon e Goldstein Le statistiche pubblicate da Wiley negli anni '80 rimangono un classico. È lucido e applicato nei suoi esempi senza essere eccessivamente teorico o legato al software.

Dillon e Goldstein è il libro che consiglierei a chiunque voglia capire da dove provengono i moderni metodi di apprendimento automatico.



0

Il ricettario R è un ottimo modo per saltare in R e iniziare a imparare come usarlo. È molto pratico, quindi è ottimo per imparare a usare la lingua, ma dovresti cercare anche un buon libro di teoria.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.