Ho un set di dati che contiene circa 7.500 esami del sangue da circa 2.500 individui. Sto cercando di scoprire se la variabilità negli esami del sangue aumenta o diminuisce con il tempo tra due test. Ad esempio, prelevo il tuo sangue per il test di base, quindi prelevo immediatamente un secondo campione. Sei mesi dopo, disegno un altro campione. Ci si potrebbe aspettare che la differenza tra il basale e i test di ripetizione immediata sia inferiore alla differenza tra il basale e il test di sei mesi.
Ogni punto sulla trama seguente riflette la differenza tra due test. X è il numero di giorni tra due test; Y è la dimensione della differenza tra i due test. Come puoi vedere, i test non sono distribuiti uniformemente lungo X - lo studio non è stato progettato per rispondere a questa domanda, davvero. Dato che i punti sono così fortemente impilati alla media, ho incluso linee quantiche al 95% (blu) e al 99% (rosso), basate su finestre di 28 giorni. Questi sono ovviamente attratti dai punti più estremi, ma hai l'idea.
testo alternativo http://a.imageshack.us/img175/6595/diffsbydays.png
Mi sembra che la variabilità sia abbastanza stabile. Semmai, è più alto quando il test viene ripetuto in un breve periodo - è terribilmente controintuitivo. Come posso affrontarlo in modo sistematico, tenendo conto della variazione di n in ogni momento (e in alcuni periodi senza test)? Le tue idee sono molto apprezzate.
Solo per riferimento, questa è la distribuzione del numero di giorni tra test e test:
testo alternativo http://a.imageshack.us/img697/6572/testsateachtimepoint.png