Un modo comune di "mentire con i dati" è usare una scala dell'asse y che fa sembrare che i cambiamenti siano più significativi di quanto non siano realmente.
Quando rivedo pubblicazioni scientifiche o rapporti di laboratorio degli studenti, sono spesso frustrato da questo "peccato di visualizzazione dei dati" (che credo che gli autori commettano involontariamente, ma si traduce comunque in una presentazione fuorviante).
Tuttavia, "avviare sempre l'asse y da zero" non è una regola rigida. Ad esempio, Edward Tufte sottolinea che in una serie temporale la linea di base non è necessariamente zero:
In generale, in una serie temporale, utilizzare una linea di base che mostra i dati non il punto zero. Se il punto zero si verifica ragionevolmente nel tracciare i dati, va bene. Ma non spendere molto spazio verticale vuoto cercando di raggiungere il punto zero a costo di nascondere ciò che sta accadendo nella stessa linea di dati. (Il libro, Come mentire con le statistiche, è sbagliato su questo punto.)
Ad esempio, ovunque, di punti zero assenti nelle serie storiche, dai un'occhiata a qualsiasi importante pubblicazione di ricerca scientifica. Gli scienziati vogliono mostrare i loro dati, non zero.
L'impulso di contestualizzare i dati è buono, ma il contesto non proviene da uno spazio verticale vuoto che arriva fino a zero, un numero che non si verifica nemmeno in molti buoni set di dati. Invece, per il contesto, mostra più dati in orizzontale!
Voglio evidenziare una presentazione fuorviante nei documenti che recensisco, ma non voglio essere un purista dell'asse y-zero.
Ci sono delle linee guida che indirizzano quando avviare l'asse y da zero e quando ciò non è necessario e / o inappropriato? (Soprattutto nel contesto del lavoro accademico.)