Wilk, MB e Gnanadesikan, R. 1968. Probabilità di tracciare metodi per l'analisi dei dati.
Biometrika 55: 1-17. Collegamento Jstor se hai accesso
Questo documento ha, al momento della mia scrittura, quasi 50 anni ma sembra ancora fresco e innovativo. Utilizzando una ricca varietà di esempi interessanti e sostanziali, gli autori unificano ed estendono una varietà di idee per tracciare e confrontare le distribuzioni usando il framework di grafici QQ (quantile-quantile) e PP (probabilità-probabilità). Le distribuzioni qui significano in generale qualsiasi set di dati o di numeri (residui, contrasti, ecc.) Derivanti dalle loro analisi.
Le versioni particolari di questi grafici risalgono a diversi decenni fa, ovviamente le probabilità normali o i grafici dei punteggi normali. che sono in questi termini grafici quantile-quantile, ovvero grafici di quantili osservati rispetto a quantili attesi o teorici da un campione della stessa dimensione da una distribuzione normale (gaussiana). Ma gli autori mostrano, con modestia ma con sicurezza, che le stesse idee possono essere estese facilmente - e praticamente con il calcolo moderno - per esaminare altri tipi di quantili e tracciare automaticamente i risultati.
Gli autori, entrambi dei Bell Telephone Laboratories, godevano di strutture informatiche all'avanguardia e anche molte università e istituti di ricerca hanno impiegato circa un decennio per recuperare il ritardo. Anche ora, le idee in questo documento meritano un'applicazione più ampia di quanto ottengano. È un raro testo o corso introduttivo che include una di queste idee oltre alla normale trama QQ. Gli istogrammi e i grafici a scatole (ciascuno spesso molto utile, ma tuttavia ciascuno scomodo e limitato in diversi modi) continuano ad essere i punti principali quando vengono introdotti i grafici delle distribuzioni.
A livello personale, anche se le idee principali di questo documento sono state familiari per la maggior parte della mia carriera, mi piace rileggerlo ogni due anni circa. Una buona ragione è il piacere nel modo in cui gli autori danno buoni risultati con idee semplici ma potenti con esempi seri. Un'altra buona ragione è il modo in cui il documento, che è scritto in modo conciso, senza la minima traccia di bombast, accenna alle estensioni delle idee principali. Più di una volta, ho riscoperto colpi di scena sulle idee principali trattate esplicitamente in suggerimenti laterali e ulteriori commenti.
Questo non è solo un documento per coloro che sono particolarmente interessati alla grafica statistica, anche se a mio avviso dovrebbe includere tutti coloro che sono interessati a statistiche di qualsiasi tipo. Promuove modi di pensare alle distribuzioni che sono praticamente utili nello sviluppo delle capacità e delle intuizioni statistiche di chiunque.