Ho letto il libro di Tukey "Exploratory Data Analysis". Scritto nel 1977, il libro sottolinea i metodi di carta / matita. Esiste un successore più "moderno" che tenga conto del fatto che ora possiamo tracciare istantaneamente grandi insiemi di dati?
Ho letto il libro di Tukey "Exploratory Data Analysis". Scritto nel 1977, il libro sottolinea i metodi di carta / matita. Esiste un successore più "moderno" che tenga conto del fatto che ora possiamo tracciare istantaneamente grandi insiemi di dati?
Risposte:
La cosa più vicina sono i dati di visualizzazione di Cleveland . Riguarda l'analisi dei dati esplorativi, riguarda le visualizzazioni generate al computer, è profonda, è un classico.
Bene, non è una replica esatta, ma ho trovato tonnellate di utili consigli di tracciamento (e codice R) in Gelman and Hill's Data Analysis utilizzando Regression e Multilevel / Hierarchical Models
Inoltre, il suo blog è spesso pieno di utili consigli grafici.
Grafica interattiva per l'analisi dei dati: principi ed esempi è uno che mi piace; la descrizione del libro dice che "discute l'analisi dei dati esplorativi (EDA) e come i metodi grafici interattivi possono aiutare a ottenere approfondimenti e generare nuove domande e ipotesi dai set di dati".
Il libro ggplot2 di Hadley Wickham è interessante perché insegna sia la grammatica della grafica sia come usare il software ggplot2.
Vale la pena menzionare qui Exploring Data in Ronald Pearson in ingegneria, scienze e medicina . Il suo principale target di lettori sembra essere gli scienziati che non hanno paura di un po 'di matematica che desiderano conoscere più statistiche. È un gruppo piuttosto numeroso, e uno ben rappresentato qui. È un po 'eccentrico e insolito, ma copre un sacco di terreno e include molti consigli sensati. Non è Tukey rivisitato nel senso che offre molte nuove idee, ma può essere gratificante studiare, anche quando pensi che sia un po 'sbagliato.
Questo libro sembra aver attirato pochissimo preavviso, molto probabilmente perché è molto costoso, ovviamente non adatto come testo di un corso e ancora disponibile solo nel libro con copertina rigida. Ma è intelligente, leggibile e privo della spazzatura dei moderni libri introduttivi (pagine e pagine di esercizi elementari, icone sciocche, foto gratuite di giovani felici, layout esigente con scatole, qualunque cosa, ecc.).
Questo ha due capitoli disponibili pubblicamente sul web che descrivono il processo di analisi dei dati e la gestione dei valori mancanti. Presto uscirà un nuovo libro di Antony Unwin.
Un'altra coppia di buoni libri da leggere sono Beautiful Visualization e Beautiful Data. Questi sono libri a cura, ci sono esempi sorprendentemente buoni di esplorazione di dati con trame e alcuni capitoli assolutamente spaventosi.
Un altro libro che contiene alcuni buoni esempi dell'uso di ggplot2 è un nuovo di Winston Chang
Penso a Comprensione dell'analisi solida ed esplorativa di Hoaglin, Mosteller e Tukey e al volume associato su Esplorazione di tabelle e forme di dati come seguito tecnico dell'EDA. Vedo anche l'analisi dei dati e la regressione, un secondo corso di statistica di Mosteller e Tukey come follow-up dell'EDA. I vari libri di Cleveland sopra menzionati sono tesori.