Contesto:
Nel frattempo ho acquisito una serie di euristiche su come tracciare in modo efficace l'associazione tra due variabili numeriche. Immagino che la maggior parte delle persone che lavorano con i dati avrebbe un insieme simile di regole.
Esempi di tali regole potrebbero essere:
- Se una delle variabili è inclinata positivamente, prendere in considerazione la stampa di quell'asse su una scala logaritmica.
- Se sono presenti molti punti dati (ad es. N> 1000), adottare una strategia diversa, ad esempio l'utilizzo di una forma di trasparenza parziale o il campionamento dei dati;
- Se una delle variabili assume un numero limitato di categorie discrete, considera l'utilizzo di un jitter o di un grafico girasole;
- Se ci sono tre o più variabili, considera l'utilizzo di una matrice scatterplot;
- È spesso utile montare una qualche forma di linea di tendenza;
- Regola le dimensioni del carattere di stampa in base alle dimensioni del campione (per n più grandi, usa un carattere di stampa più piccolo);
- e così via.
Domanda:
Mi piacerebbe essere in grado di indirizzare gli studenti a una pagina Web o un sito che spiega questi e altri trucchi per tracciare in modo efficace le associazioni tra due variabili numeriche, forse con esempi.
- Ci sono pagine o siti su Internet che fanno un buon lavoro in questo senso?