Moderno successore dell'analisi dei dati esplorativi di Tukey?


52

Ho letto il libro di Tukey "Exploratory Data Analysis". Scritto nel 1977, il libro sottolinea i metodi di carta / matita. Esiste un successore più "moderno" che tenga conto del fatto che ora possiamo tracciare istantaneamente grandi insiemi di dati?


questo dovrebbe essere wiki della comunità?
richiemorrisroe,

Non mi è chiaro se questo dovrebbe essere CW. Potrebbero non esserci buone risposte; ci può essere una chiara risposta eccezionale; potremmo generare un lungo elenco di risposte efficaci. Vediamo cosa succede.
whuber

4
Questa è una buona domanda, biofreezer. Volevo solo notare che esistono strette analogie con altri metodi di lavoro. Il mio preferito è, la penna e la carta EDA è per le statistiche moderne come gli utensili manuali sono per la moderna lavorazione del legno. (La lavorazione del legno "moderna" impiega molti utensili elettrici come seghe da tavolo e router che consentono anche ai principianti di ottenere risultati accettabili in molto meno tempo. Tuttavia, questi strumenti rappresentano anche migliaia di cifre e arti mancanti ogni anno. Le persone che imparano a usare gli utensili manuali generalmente imparano a lavorare meglio e in modo più efficiente anche quando impiegano utensili elettrici.)
whuber

4
Sì, la lavorazione del legno è una bella analogia (cifre mancanti, cifre mancanti). Vedi anche software-carpentry.org .
denis,

Risposte:






4

Vale la pena menzionare qui Exploring Data in Ronald Pearson in ingegneria, scienze e medicina . Il suo principale target di lettori sembra essere gli scienziati che non hanno paura di un po 'di matematica che desiderano conoscere più statistiche. È un gruppo piuttosto numeroso, e uno ben rappresentato qui. È un po 'eccentrico e insolito, ma copre un sacco di terreno e include molti consigli sensati. Non è Tukey rivisitato nel senso che offre molte nuove idee, ma può essere gratificante studiare, anche quando pensi che sia un po 'sbagliato.

Questo libro sembra aver attirato pochissimo preavviso, molto probabilmente perché è molto costoso, ovviamente non adatto come testo di un corso e ancora disponibile solo nel libro con copertina rigida. Ma è intelligente, leggibile e privo della spazzatura dei moderni libri introduttivi (pagine e pagine di esercizi elementari, icone sciocche, foto gratuite di giovani felici, layout esigente con scatole, qualunque cosa, ecc.).



0

Un'altra coppia di buoni libri da leggere sono Beautiful Visualization e Beautiful Data. Questi sono libri a cura, ci sono esempi sorprendentemente buoni di esplorazione di dati con trame e alcuni capitoli assolutamente spaventosi.

Un altro libro che contiene alcuni buoni esempi dell'uso di ggplot2 è un nuovo di Winston Chang


1
Voglio solo ricontrollare, Di, nel caso in cui si fosse insinuato un errore di battitura sottile: intendevi forse scrivere "accattivante" anziché "spaventoso"? Sebbene entrambi abbiano un senso in questo contesto, l'aspetto di quest'ultimo - senza ulteriori spiegazioni - è piuttosto una sorpresa!
whuber

2
spaventoso era corretto - è un miscuglio - i volumi modificati spesso lo sono
Dianne Cook l'

Sono sorpreso da questi consigli. Ho trovato entrambi i libri per lo più deludenti (long on guff, short on graphic). Sfortunatamente O'Reilly, che ho incontrato per la prima volta come editore di libri Unix straordinariamente buoni, sembra avere un controllo di qualità molto irregolare per i libri su qualsiasi cosa anche lontanamente statistica.
Nick Cox,

Mi piacciono entrambi i libri e credo davvero che siano contributi sostanziali. Winston Chang ha molti dettagli di base sulla stampa con ggplot2. È un buon riferimento per i principianti. Non ti dice molto sul motivo per cui dovresti fare queste trame, ma la maggior parte ha un buon senso per lo scopo, dai pezzi che ho letto. The Beautiful Visualization ha alcuni capitoli davvero impressionanti, che affrontano problemi difficili come la visualizzazione di Wikipedia, dati enormi, molte complessità e passa attraverso il processo di pensiero / le decisioni prese per fare le trame.
Dianne Cook,

Nel caso in cui il mio commento sia ambiguo: mi riferivo ai libri "Bellissimi". Il libro di Winston Chang è simpatico e utile.
Nick Cox,

0

Penso a Comprensione dell'analisi solida ed esplorativa di Hoaglin, Mosteller e Tukey e al volume associato su Esplorazione di tabelle e forme di dati come seguito tecnico dell'EDA. Vedo anche l'analisi dei dati e la regressione, un secondo corso di statistica di Mosteller e Tukey come follow-up dell'EDA. I vari libri di Cleveland sopra menzionati sono tesori.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.