Il documento canonico qui era
Wilk, MB e R. Gnanadesikan. 1968. Metodi di tracciabilità delle probabilità per l'analisi dei dati. Biometrika 55: 1-17
e ripaga ancora la lettura ravvicinata e ripetuta.
È stato dato un trattamento lucido con molti buoni esempi
Cleveland, WS 1993. Visualizzazione dei dati. Summit, NJ: Hobart Press.
e vale la pena menzionare il più introduttivo
Cleveland, WS 1994. Gli elementi dei dati grafici. Summit, NJ: Hobart Press.
Altri testi contenenti una ragionevole esposizione a questo approccio includono
Davison, AC 2003. Modelli statistici. Cambridge: Cambridge University Press.
Rice, JA 2007. Statistica matematica e analisi dei dati. Belmont, CA: Duxbury.
A parte questo, non so nulla di tutto ciò che chiedi. Una volta che hai visto il punto dei grafici quantile-quantili, mostrare in dettaglio che gli istogrammi sono un'alternativa di secondo livello non sembra né interessante né utile, troppo come sparare ai pesci in un barile.
Ma vorrei riassumere in questo modo:
Il binning elimina i dettagli e i dettagli sono spesso importanti. Questo può applicarsi non solo a ciò che sta accadendo nelle code, ma anche a ciò che sta accadendo nel mezzo. Ad esempio, la granularità o la multimodalità possono essere importanti così come l'asimmetria o il peso della coda.
Il binning richiede decisioni sull'origine e sulla larghezza del contenitore, il che può influire notevolmente sull'aspetto degli istogrammi, quindi è difficile vedere ciò che è reale e ciò che è un effetto collaterale delle scelte. Se il tuo software prende queste decisioni per te, i problemi rimangono. (Ad esempio, le scelte del cestino predefinite sono spesso progettate in modo da non utilizzare "troppi bidoni", cioè con il motivo di levigare un po ')
Il problema grafico e psicologico di confrontare due istogrammi è più complicato di quello di giudicare l'adattamento di una serie di punti a una linea retta.
[Aggiunto il 27 settembre 2017] 4. I grafici quantici possono essere variati molto facilmente se si considerano una o più scale trasformate. Per trasformazione qui intendo una trasformazione non lineare, non ad esempio ridimensionamento per un massimo o standardizzazione per (valore-media) / SD. Se i quantili sono solo le statistiche dell'ordine, tutto ciò che devi fare è applicare la trasformazione, come ad esempio il logaritmo del massimo è identicamente il massimo dei logaritmi, e così via. (Trivialmente, la reciprocazione inverte l'ordine.) Anche se tracciate i quantili selezionati che si basano su statistiche di due ordini, di solito vengono semplicemente interpolati tra due valori di dati originali e l'effetto dell'interpolazione è banale. Al contrario, gli istogrammi sul registro o altre scale trasformate richiedono una nuova decisione sull'origine e sulla larghezza del contenitore che non è particolarmente difficile, ma non è banale. Lo stesso si può dire della stima della densità come modo di riassumere la distribuzione.