Quale libro è raccomandabile per iniziare ad apprendere le statistiche usando R contemporaneamente?


50

Libri per imparare le statistiche usando R

Qual è esattamente il libro che sto cercando.

Quello che sto cercando è un libro che ti insegna le statistiche mentre usi R per darti esperienza pratica e quindi finire per aiutarti a imparare R insieme. Ho visto su Amazon molti libri che tentano di farlo, ma non con R. Gli esempi sono Minitab e SAS.

Il libro R e il calcolo statistico sono un'opzione? - Ancora non risposto .

Il libro R e il calcolo statistico: un'introduzione all'analisi dei dati usando S-Plus sembra fattibile, ma un'opinione del lettore qui sarebbe utile e benvenuta.

In che modo il libro si collega ai corsi di statistica?

Per essere ancora più precisi su ciò che stavo cercando, considera questi due corsi risultati di apprendimento sulle statistiche di un dipartimento di matematica all'università. Attualmente sono uno studente:

Statistiche intermedie e Probabilità e statistiche , cioè sto guardando in un libro un normale corso di statistica che va al livello intermedio ma piuttosto che solo carta e cartone che ti fa imparare e usare R invece. Ciò significa anche che sto cercando un libro che presume che io voglia imparare le statistiche dall'inizio.

Questo libro è anche per i ricercatori.

Sono anche un ricercatore di software engineer, ma immagino la situazione attuale in cui ti trovi con montagne di dati e voglio imparare le statistiche per continuare a scrivere codice per automatizzare che è praticamente applicabile a molti altri campi.

Ciò significa che non sono interessato a imparare ogni singolo dettaglio di ogni singola proprietà per ogni singola curva, ma sono più interessato a dare un senso ai dati per il mio dominio di ricerca, anche se non mi dispiacerebbe se il libro volesse approfondire quello .

Come motivazione finale, mi ritrovo a leggere articoli scientifici in diversi tipi di comunità che rivendicano risultati basati sull'inferenza statistica mentre non ci sono prove leggibili se le ipotesi / vincoli statistici sono stati violati o meno.

Un libro AR che non tratta molto delle statistiche non mi assicurerà che non seguirò questa pratica, motivo per cui ho deciso di cercare un libro simile a un corso di statistica usando R piuttosto che giocare con un libro di sintesi.

Domande correlate in Convalida incrociata.

Risposte e feedback per questa domanda.

@Julie

I libri suggeriti erano pochi che ho già incontrato, ma sono un esempio che purtroppo non mi va bene:

Statistiche introduttive con R , utilizzo di R per statistiche introduttive , statistiche: un'introduzione con R sono alcuni dei libri che ho già visto su Amazon, ma riguardano una panoramica delle statistiche o fanno ipotesi che richiedono conoscenze statistiche precedenti. Il problema con i libri di sintesi riguarda principalmente il non richiamare l'attenzione su ipotesi, vincoli e fornire spiegazioni sufficienti per dare un senso all'informazione.

Se ritieni che non ci sia un libro che possa adattarsi anche a questo bisogno o pensi che il libro R o il calcolo statistico: un'introduzione all'analisi dei dati usando S-Plus si adatterà a questo, apprezzerei anche questo tipo di risposta.

@Christopher Aden

Introduzione a Probabilità e Statistica L'uso di R sembra essere il più vicino, ma è ancora un concetto generale di ciò che stavo cercando.

Quello che mi aspettavo è un libro come David S. Moore, The Basics of Statistics perché:

  • Copre tutti gli argomenti statistici.
  • Utilizza due strumenti, miniTab e altri per fornire l'apprendimento pratico sul metodo appena spiegato.
  • Evidenzia moltissimo ipotesi e vincoli. Questo è molto importante per un ricercatore che non ha seguito un corso statistico approfondito e desidera utilizzare le statistiche. Difficilmente i libri di sintesi li copriranno, il che è pericoloso per i ricercatori.
    • Puoi vedere il sommario del libro qui . Notare come il focus sia la statistica e l'utilizzo degli strumenti sia per migliorare la comprensione e far conoscere allo studente come utilizzare gli strumenti per fare le statistiche dopo aver appreso in modo più semplice. Non si tratta dello strumento, si tratta di statistiche!

Voglio esattamente la stessa cosa, ma usando R.

@Gregory Demin

Usa R come esempi di pedagogia, presume che tu voglia imparare le statistiche e, soprattutto, è open source. Sfortunatamente, non copre ANOVA né ANCOVA o argomenti più avanzati.

@Peter Ellis

Un buon suggerimento per un libro di testo che copre ciò che si desidera in questa domanda.

Libri nell'opinione comune che rispondono alla domanda.

@Peter Ellis e @Gregory Demin.

Collezione di libri R su Amazon

La discussione di Amazon sui libri R per diversi background di studenti può essere trovata qui .

Lezioni video che insegnano le statistiche usando R

Google Tech Talks del 2007 ha anche motivato questa domanda e tratta di più sul Data Mining piuttosto che sulle statistiche, ma utilizzando R insieme qui .

Risposte:


15

Penso che uno dei motivi per cui è così difficile rispondere sia che R sia così potente e flessibile che una vera introduzione alla programmazione di R va ben oltre ciò che è normalmente necessario in un'introduzione alle statistiche. I libri che insegnano le statistiche usando MiniTab, JMP o SPSS stanno facendo cose relativamente semplici con il software che a malapena graffia la superficie di ciò che R è capace quando si tratta di manipolazione dei dati, simulazioni, funzioni personalizzate, ecc.

Detto questo, penso che le moderne statistiche di Wilcox per le scienze sociali e comportamentali: un'introduzione pratica (2012) siano un nuovo brillante libro. Non presuppone alcuna conoscenza statistica e ti porta da zero fino a una vasta gamma di moderne tecniche robuste; e presuppone non una conoscenza R molto maggiore della capacità di aprirla e caricare un set di dati. Copre anche molte delle tecniche classiche tra cui ANOVA (menzionata nel PO).

Vorrei vedere questo libro come l'equivalente dei libri che introducono le statistiche e un pacchetto di statistiche come SPSS allo stesso tempo. Tuttavia, non ti insegnerà a programmare in R - solo come fare con la moderna analisi statistica, con un'enfasi su solide tecniche che affrontano i problemi noti con l'analisi classica che sono messi da parte dalla maggior parte degli altri approcci all'insegnamento delle statistiche.

I tre problemi con i metodi classici che questo libro affronta in particolare sin dall'inizio sono il campionamento da distribuzioni dalla coda pesante; asimmetria; ed eteroscedasticità.

Wilcox usa R perché "In termini di sfruttamento delle moderne tecniche statistiche, R domina chiaramente. Nell'analisi dei dati, è senza dubbio lo sviluppo software più importante nell'ultimo quarto di secolo. Ed è gratuito. Sebbene i metodi classici presentino difetti fondamentali , non si suggerisce che siano completamente abbandonati ... Di conseguenza, vengono fornite illustrazioni su come applicare metodi standard con R. Di particolare importanza qui è che, inoltre, vengono fornite illustrazioni su come applicare metodi moderni utilizzando oltre 900 R funzioni scritte per questo libro ".

Questo libro è così eccellente che dopo aver acquistato una copia per lavoro ho acquistato la mia copia a casa.

I titoli dei capitoli sono:

  1. riepiloghi numerici e grafici dei dati;
  2. probabilità e concetti correlati;
  3. distribuzioni campionarie e intervalli di confidenza;
  4. controllo di un'ipotesi;
  5. regressione e correlazione;
  6. metodi bootstrap;
  7. confrontando due gruppi indipendenti;
  8. confrontare due gruppi dipendenti;
  9. ANOVA a senso unico;
  10. design a due e tre vie;
  11. confrontando più di due gruppi dipendenti;
  12. confronti multipli;
  13. alcuni metodi multivariati;
  14. regressione robusta e misure di associazione;
  15. metodi di base per l'analisi dei dati categorici;

Ulteriore modifica : dopo aver verificato l'esempio di David Moore di ciò che stai cercando, penso davvero che il libro di Wilcox soddisfi l'esigenza.


1
Grazie mille sono felice di avere un altro riferimento disponibile anche come tomo stampabile. Modificherò il post principale in seguito per includere il tuo riferimento se nessuno lo fa entro questo momento! Davvero molto apprezzato. Giusto per confermare, vuoi dire che ti insegna a tracciare la teoria che è menzionata? Questo è più che perfetto per me! Si prega di confermare
Oeufcoque Penteano,

Non sono del tutto sicuro di cosa intendi per "tracciare la teoria", ma certamente fa ampio uso dei grafici e ha il codice R per fare tutte le teorie che copre (sia l'inferenza statistica che la trama). Wilcox fornisce anche il proprio pacchetto di funzioni o riferimenti ad altri per i solidi approcci all'avanguardia sviluppati negli ultimi decenni. Ogni tecnica viene fornita con esempi incluso il codice. Ho modificato la risposta per includere le intestazioni di capitolo.
Peter Ellis,

Sì, hai capito bene! I pezzi di codice che mi aiutano a fare tutta la teoria su R sarebbero i benvenuti e necessari in quello che sto esaminando. Grazie per aver fornito l'elenco! Avevo anche bisogno di un libro che parlasse di bootstrap. Ho già ordinato questo libro. Modificherà presto il post principale.
Oeufcoque Penteano,

Sto già sfogliando questo libro. +500 su questo suggerimento, ESATTAMENTE quello che stavo cercando: un tomo grasso pieno di informazioni sulle statistiche e la funzione appropriata per usarlo su R (che è gratuito e open source yay!). È molto economico per le dimensioni di questo libro e la sua unicità. Non avere paura di essere per le scienze comportamentali. Lo sto usando nonostante io sia uno studente CS. Ho trovato i libri di statistica comportamentale per me ancora più utili di quelli statistici per capire cosa sta succedendo. Non sto dicendo che una statistica pura sia inutile, ne hai bisogno. Ho usato Paul Meyer (1965).
Oeufcoque Penteano,


4

Il post di Julie del libro di Verzani è davvero una buona scelta per qualcuno che non ha esperienza di R o statistica. È abbastanza morbido sia sulla R che sulle statistiche che viene utilizzato dal dipartimento di scienze politiche della UC Davis, e quegli studenti non hanno né lezioni di programmazione né matematica di livello superiore. Il suo lavoro è disponibile attraverso il suo pacchetto CRAN, simpleR .
Dal momento che provieni da un background informatico, non penso che tu abbia bisogno di una presentazione molto delicata di R. Suppongo che tu abbia una discreta conoscenza delle strutture dati, dell'ambito e del perché hai bisogno di un debugger. Per una prospettiva molto incentrata sull'informatica su R (più di quanto potresti persino vedere in una classe di programmazione statistica in un dipartimento statistico universitario), dai un'occhiata a The Art of R Programming di Norm Matloff. Per vedere se ti interessa, Matloff ha una versione prestampata molto approssimativa disponibile sul suo sito web . Se ti piace il suo stile, consiglierei di prendere la copia finita. È professore di CS e scrive il libro più per un pubblico di CS che per un pubblico di statistiche.
G. Jay Kerns (un poster frequente qui) ha anche un libro disponibile online chiamato Introduzione alla Probabilità e Statistica Utilizzando R . Personalmente ritengo che sia un servizio meraviglioso per introdurre l'intestino di R.
Mi rendo conto che la tua domanda è mirata a ottenere risposte rivolte a un maggiore CS, ma per favore consulta anche questo argomento: Quale libro consiglieresti agli scienziati non statistici?


1
Credo che l'introduzione alla probabilità e alle statistiche usando R sia la più vicina ma non ancora quella che sto cercando. Sto modificando la domanda in un secondo per dare un riferimento esattamente a ciò che sto cercando, ma purtroppo usa miniTab invece di R. L'arte della programmazione R sembra più preoccupata per R che per il fatto di apprendere le statistiche (correggimi se lo sono sbagliato), e di nuovo il libro precedente mi preoccupa di essere abbastanza rigoroso nelle statistiche per fare ipotesi sullo sfondo delle statistiche, che purtroppo mi manca. Riassumerò anche i punti principali.
Oeufcoque Penteano,

Hai ragione su TAoRP: pone più enfasi sulla programmazione che sull'apprendimento delle statistiche. Sono un po 'confuso dalla tua domanda però. A meno che tu non voglia iniziare a imparare le statistiche matematiche, devi fare alcune ipotesi e accettarle con fede - almeno per un breve periodo. Vuoi un libro che introduce le statistiche, fa esempi in R e non sorvola le ipotesi? La maggior parte dei libri introduttivi fornirà alcune intuizioni alla base delle ipotesi di modellazione, ma potrebbe non formalizzare la logica. Probabilmente dovrai leggere un libro di statistiche matematiche per quello.
Christopher Aden,

Si prega di consultare il libro che ho appena menzionato sulla mia ultima modifica sulla domanda. Fa esattamente quello che volevo. In effetti la domanda è venuta fuori dalla lettura di pezzi di questo libro. Voglio la stessa cosa, ma con R. ho anche evidenziato in punti elenco ciò che nel libro è così importante per l'enorme parte della motivazione per coloro che non si sono mai imbattuti nel libro. Spero sia chiaro adesso. L'indice del libro può essere visto anche qui whfreeman.com/Catalog/product/…
Oeufcoque Penteano

3

Ho trovato questo libro di grande utilità, ma presuppone una certa conoscenza dei termini statistici di base, come p-value, ANOVA, eccetera.

Questo libro offre un'introduzione molto più delicata ai concetti statistici stessi ...


+1. Il libro di Verzani è un'introduzione molto delicata ed è disponibile anche dal suo pacchetto CRAN. Anche il libro di Dalgaard è carino, e sicuramente parla come un esperto, non essendo estraneo al mondo R!
Christopher Aden,

@ChristopherAden - quale libro consiglieresti di costruire una solida base per pensare concettualmente alla statistica , senza approfondire (per niente, davvero) la matematica stessa?
Julie

@ Julie, qual è il tuo maggiore? Uno di quei giorni ho ricevuto un libro del 1979 sulle statistiche per gli studenti di sociologia di un professore sociale. A volte sono più utili, anche se un professore menzionato su Amazon commenta che tendono a fare più errori specialmente su formule che sono pericolose per i professori che non sono troppo in statistica :(
Oeufcoque Penteano

Julie: Questa è sicuramente una domanda che esaminerò per dare consigli migliori. Ho imparato dalla statistica: l'arte e la scienza dell'apprendimento dai dati, di Agresti e Franklin. Ho scoperto che l'approccio basato sull'applicazione è eccezionale. Non offre la suddivisione 50-50 delle statistiche-e-R che l'OP voleva, quindi non mi sono preoccupato di menzionarlo. Tuttavia, sono ancora un novellino delle statistiche, quindi prendi le mie cose con un pizzico di sale.
Christopher Aden,

1
Ciao Julie Sarebbe bello se tu potessi fornire una citazione completa per ogni libro nella tua risposta. :)
cardinale

1

Un buon libro è prodotto tramite l'Università di Adelaide ed è disponibile gratuitamente online e come acquisto per copia cartacea.

Apprendimento delle statistiche con R

È molto ben suddiviso nella sua struttura e copre un'introduzione a R e un'introduzione di base alle statistiche prima di passare ad argomenti più approfonditi.

C'è un elenco molto profondo di libri sul sito Web di R che lo fornisce come riferimento, ma al momento non ho letto i titoli, che aggiornerò mentre procederò.

https://www.r-project.org/doc/bib/R-books.html


0

Apprendimento delle statistiche usando R di Randall E. Schumacker uscirà a gennaio 2014 da SAGE Publications. Contiene tutto il materiale nella pubblicazione.


3
Va bene per le persone farci sapere del proprio lavoro. Apprezziamo profondamente avere quel tipo di conoscenza diretta. È più che una buona idea riconoscere la propria connessione con qualsiasi raccomandazione: dà alla raccomandazione più credibilità e ti dà anche il credito che meriti :-). Forse potresti cogliere l'occasione, Randy, per amplificare la tua risposta, riconoscere la tua paternità e dire di più sul perché il tuo libro sarebbe un'ottima scelta per gli scopi indicati nella domanda. E benvenuti nel nostro sito!
whuber
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.