Da +1 a @NickSabbe, perché "la trama ti dice semplicemente che" qualcosa non va "", che è spesso il modo migliore per usare una trama qq (poiché può essere difficile capire come interpretarli). È possibile imparare come interpretare una trama qq pensando a come crearne una, comunque.
Cominceresti ordinando i tuoi dati, poi saliresti dal valore minimo prendendo ciascuno come una percentuale uguale. Ad esempio, se avevi 20 punti dati, quando contavi il primo (il minimo), ti dicevi: "Ho contato il 5% dei miei dati". Seguiresti questa procedura fino alla fine, a quel punto avresti passato il 100% dei tuoi dati. Questi valori percentuali possono quindi essere confrontati con gli stessi valori percentuali della corrispondente norma teorica (cioè la normale con la stessa media e SD).
Quando vai a tracciare questi, scoprirai che hai problemi con l'ultimo valore, che è il 100%, perché quando hai superato il 100% di un normale teorico sei "all'infinito". Questo problema viene risolto aggiungendo una piccola costante al denominatore in ciascun punto dei dati prima di calcolare le percentuali. Un valore tipico sarebbe quello di aggiungere 1 al denominatore; ad esempio, chiameresti il tuo primo (di 20) punto dati 1 / (20 + 1) = 5% e il tuo ultimo sarebbe 20 / (20 + 1) = 95%. Ora, se tracciate questi punti contro una corrispondente norma teorica, avrete una trama in pp(per tracciare le probabilità contro le probabilità). Una trama del genere mostrerebbe molto probabilmente le deviazioni tra la tua distribuzione e una normale al centro della distribuzione. Questo perché il 68% di una distribuzione normale si trova all'interno di +/- 1 DS, quindi i grafici in pp hanno una risoluzione eccellente lì e una scarsa risoluzione altrove. (Per ulteriori informazioni su questo punto, può essere utile leggere la mia risposta qui: grafici PP vs grafici QQ .)
Spesso, siamo più preoccupati per ciò che sta accadendo nelle code della nostra distribuzione. Per ottenere una migliore risoluzione lì (e quindi una peggiore risoluzione nel mezzo), possiamo invece costruire un diagramma qq . Lo facciamo prendendo le nostre serie di probabilità e facendole passare attraverso l'inverso del CDF della distribuzione normale (è come leggere la tabella z sul retro di un libro delle statistiche al contrario - leggi una probabilità e leggi una z- Punto). Il risultato di questa operazione sono due insiemi di quantili , che possono essere tracciati uno contro l'altro in modo simile.
@whuber ha ragione sul fatto che la linea di riferimento viene tracciata in seguito (in genere) trovando la linea di adattamento migliore attraverso il 50% medio dei punti (ovvero, dal primo quartile al terzo). Questo viene fatto per rendere la trama più facile da leggere. Usando questa linea, puoi interpretare la trama come se ti mostrasse se i quantili della tua distribuzione divergono progressivamente da una vera normalità mentre ti muovi nelle code. (Nota che la posizione dei punti più lontani dal centro non è realmente indipendente da quelli più vicini; quindi il fatto che, nel tuo istogramma specifico, le code sembrano unirsi dopo che le 'spalle' differiscono non significa che i quantili ora sono di nuovo uguali.)
È possibile interpretare un diagramma qq in modo analitico considerando i valori letti dal confronto degli assi per un dato punto tracciato. Se i dati sono stati ben descritti da una distribuzione normale, i valori dovrebbero essere più o meno gli stessi. Ad esempio, prendi il punto estremo nell'angolo in basso a sinistra: il suo valore è da qualche parte oltre , ma il suo valore è solo un po 'oltre , quindi è molto più lontano di quanto dovrebbe "essere". In generale, una semplice rubrica per interpretare un diagramma qq è che se una data coda si attorciglia in senso antiorario dalla linea di riferimento, ci sono più dati in quella coda della tua distribuzione che in una normale teoria, e se una coda si attorciglia in senso orario lì è di meno- 3 y - .2x−3y−.2dati in quella coda della tua distribuzione che in una normale teoria. In altre parole:
- se entrambe le code ruotano in senso antiorario, si hanno code pesanti ( leptokurtosi ),
- se entrambe le code ruotano in senso orario, si hanno code leggere (platicurtosi),
- se la coda destra si gira in senso antiorario e la coda sinistra si gira in senso orario, si ha l'inclinazione a destra
- se la tua coda sinistra gira in senso antiorario e la tua destra gira in senso orario, hai lasciato l'inclinazione