Sto facendo studi sull'associazione SNP GWAS sulle malattie usando un software chiamato plink ( http://pngu.mgh.harvard.edu/~purcell/plink/download.shtml ).
Con i risultati dell'associazione ottengo valori p per tutti gli SNP che sono stati analizzati. Ora, uso un diagramma QQ di quei valori p per mostrare se un valore p molto basso differisce dalla distribuzione attesa dei valori p (una distribuzione uniforme). Se un valore p si discosta dalla distribuzione attesa, si può "chiamare" quel valore p per una statistica significativa.
Come puoi vedere nel diagramma QQ, nella parte superiore della coda, gli ultimi 4 punti sono piuttosto difficili da interpretare. Due degli ultimi punti in grigio indicano che quei valori p sono nella distribuzione prevista dei valori p, mentre gli altri due no.
Ora, come interpretarlo, gli ultimi due punti hanno valori p più bassi ma non sono "significativi" secondo il diagramma QQ, mentre gli altri due punti con valori p più alti sono "significativi"? Come può essere vero?