Esiste un "ciao, mondo" per la grafica statistica?


26

Nella programmazione informatica, esiste un primo programma classico per l'apprendimento / insegnamento di una nuova lingua o sistema, chiamato "ciao, mondo". http://en.wikipedia.org/wiki/Hello_world_program

Esiste una classica prima visualizzazione dei dati per l'utilizzo di un pacchetto grafico? Se è così, che cosa è? E se no, quali sarebbero i buoni candidati?


3
Benvenuti nel nostro sito! Il nostro faq chiede che "Dovresti solo porre domande pratiche e rispondenti in base ai problemi reali che affronti". Potresti approfondire qual è il tuo vero problema?
whuber

3
Vorrei identificare l '"elemento di prova standard" per la grafica statistica, se presente, da includere nel materiale di formazione che sto sviluppando.
Abraham D Flaxman,

2
Poiché le applicazioni grafiche variano così ampiamente, è difficile concepire alcuni elementi grafici standard o universali. Ci sono alcuni standard per alcuni tipi di pacchetti di rappresentazione grafica, come coniglietti storicamente famosa e teiere per la grafica 3D. Affinché la tua domanda sia rispondente, quindi, sarebbe utile che fosse più specifico su quale / i pacchetto / i il materiale di formazione sarà destinato a coprire.
whuber

1
Buon punto, grazie. Includerò almeno qualcosa sulla grafica statistica in R, STATA, Python e Javascript.
Abraham D Flaxman,

@AbrahamDFlaxman Sono curioso di conoscere questo "materiale di formazione" e per chi e per cosa è destinato. Puoi dire di più?
Peter Flom - Ripristina Monica

Risposte:


9

Due pensieri:

R. Quando provo ad arrivare all'essenza di "Hello World", è il minimo che deve essere fatto nel linguaggio di programmazione per generare un programma valido che stampi una singola riga di testo. Ciò mi suggerisce che il tuo "Hello World" dovrebbe essere un set di dati univariato, la cosa più semplice che potresti collegare a un programma statistico o grafico.

B. Non sono a conoscenza di alcun grafico "Hello World". Il più vicino che posso venire è insiemi di dati tipici che sono inclusi in vari pacchetti statistici, come AirPassengers di R. In R, una dichiarazione grafica di Hello World sarebbe:

plot (AirPassengers)  # Base graphics, prints line graph

o

qplot (AirPassengers) # ggplot2, prints a bar chart

o

xyplot (AirPassengers) # lattice, which doesn't have a generic plot

Personalmente, penso che il grafico più semplice sia un grafico a linee in cui hai N elementi negli intervalli Y e X da 1: N. Ma questo non è uno standard.


2
Il consenso di questa e di altre risposte è che al momento non esiste un "ciao, mondo" di grafica statistica. Penso che il tuo suggerimento di un set di dati univariato, con N elementi in Y e X che vanno da 1: N sia convincente. In ulteriore analogia con "ciao, mondo", sarebbe bello avere una piccola N e memorabile Y. Cosa ne pensi di N = 5 e Y = (3,1,4,1,5,9) (ie cifre di pi)? Forse è troppo math.
Abraham D Flaxman,

1
@AbrahamDFlaxman: non penso sia per la matematica, penso che sia grandioso. Memorabile, breve, e il grafico non è solo una linea retta o altro. I dati sono ben noti e non legati ad alcun programma particolare e possono essere arbitrariamente estesi da chiunque desideri più punti. Io voto per questo!
Wayne,

24

Probabilmente inizierei con grafici a dispersione e dimostrerei le quattro brutte correlazioni .


2
+1. Ma potresti voler considerare qualcosa di un po 'più generale, come una forma di trama della linea. Dopotutto, non appena puoi disegnare un segmento di linea, puoi disegnare qualsiasi cosa . Questo fa eco all'idea "Ciao, mondo!": Una volta che puoi ottenere un output leggibile da un programma, sai che puoi comunicare con il computer e il resto sono solo dettagli :-). (I dettagli possono essere difficili . Quando si impara a scrivere il codice assembly per il mainframe IBM 360, il modo più semplice per ottenere l'output era di memorizzarlo nella RAM e creare un errore alla fine dell'esecuzione, facendo sì che il sistema stampasse un dump core esadecimale !)
whuber

Credo che il quartetto di Anscombe in totale contiene troppo per essere il usato come "ciao, mondo" di grafica statistica, ma figura 1 dalla sua carta potrebbe essere un buon candidato. Altre risposte hanno fatto valere la necessità di un set di dati univariato, a cui mi sto appoggiando.
Abraham D Flaxman,

7

L'istogramma di un campione di una variabile casuale normalmente distribuita.


Mi piace come apparirebbe, ma forse gli istogrammi richiedono più elaborazioni dei dati rispetto agli scatter, e trovare campioni dalla distribuzione normale può essere fonte di distrazione.
Abraham D Flaxman,

Ho appena notato che questo è il primo esempio dalla pagina Web di Matplotlib
Abraham D Flaxman,

5

Penso che la risposta sia no". Cioè, non esiste una risposta generalmente concordata alla tua domanda.

@StasK indica il grafico a dispersione.

Ma considererei cosa plotfaR : dipende dai dati!

Si potrebbe sostenere che le statistiche univariate sono più semplici di quelle bivariate. Quindi ... forse la cosa più semplice è un istogramma; o forse un grafico a barre; forse un diagramma della densità.

Se il punto di "Ciao, mondo!" è dimostrare che puoi fare qualcosa al computer, quindi direi che qualsiasi trama farebbe.


1
Forse l'assenza di un oggetto di prova standard indica che hai ragione, ed è più appropriato usare qualunque trama sia più semplice nel sistema che viene dimostrato. Ciò rende difficile il confronto, tuttavia.
Abraham D Flaxman,

5

Non sono sicuro che si qualifichi esattamente come un mondo ciao, ma in R ci sono anche demo integrate in molti pacchetti. per esempio

library(graphics)
demo(graphics)

guiderà l'utente attraverso alcuni elementi grafici di base disponibili nel pacchetto. Basta fare clic con il mouse su ogni immagine per scorrere le illustrazioni grafiche di base. Con solo due righe, l'utente viene introdotto in alcune delle capacità ispiratrici della grafica R per le statistiche.

Il codice corrispondente per generare la grafica viene visualizzato nella R console.

inserisci qui la descrizione dell'immagine


2

Direi che c'erano due programmi di tipo "Hello World" per la visualizzazione dei dati:

Stampa ("Hello World"): qualcosa come l'istogramma di una variabile normalmente distribuita, o forse un semplice grafico a dispersione X, Y.

Per qualcosa di leggermente più complesso, come la sezione in cui si prendono i principi di Hello World e si inizia a giocare con l'input dell'utente, i caratteri di escape e simili, direi che giocherebbe con il set di dati Iris.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.