Ho i risultati del test di un esame del sangue somministrato a 2500 persone quattro volte a intervalli di sei mesi. I risultati consistono principalmente in due misure di risposta immunitaria: una in presenza di alcuni antigeni della tubercolosi, una in assenza. Attualmente, ciascun test viene valutato positivo o negativo in base alla differenza tra la risposta dell'antigene e la risposta nulla (con l'idea che se il sistema immunitario risponde agli antigeni della tubercolosi, è probabile che tu sia stato esposto al batterio stesso ad un certo punto ). In sostanza, il test suppone che le distribuzioni di un individuo non esposto delle risposte zero e TB debbano essere sostanzialmente identiche, mentre una persona con esposizione alla TB avrà risposte TB provenienti da una distribuzione diversa (di valori più alti). Avvertimento: le risposte sono molto, molto non normali, e i valori si aggregano sia sul pavimento naturale che sul soffitto troncato dallo strumento.
Tuttavia, sembra abbastanza chiaro in questa impostazione longitudinale che stiamo ottenendo "falsi positivi" (nessun vero gold standard per la tubercolosi latente, temo) che sono causati da (tipicamente piccole) fluttuazioni dell'antigene e risposte nulle. Sebbene ciò possa essere difficile da evitare in alcune situazioni (potresti avere solo una possibilità di testare qualcuno), ci sono molte situazioni in cui le persone vengono regolarmente testate per la tubercolosi ogni anno o giù di lì - negli Stati Uniti, questo è comune per gli operatori sanitari, i militari, i senzatetto che soggiornano nei rifugi e così via. Sembra un peccato ignorare i risultati dei test precedenti perché i criteri esistenti risultano trasversali.
Io penso che quello che mi piacerebbe fare è quello che crudamente concepire come l'analisi miscela longitudinale. Proprio come i criteri trasversali, vorrei essere in grado di stimare la probabilità che le risposte TB e nulle di un individuo siano tratte dalla stessa distribuzione, ma che tale stima includa i risultati dei test precedenti, nonché le informazioni dal campione come un insieme (ad esempio, posso usare la distribuzione a livello di campione delle variabilità all'interno dell'individuo per migliorare le mie stime della distribuzione specifica di zero o TB di un individuo?). La probabilità stimata dovrebbe essere in grado di cambiare nel tempo, ovviamente, per tenere conto della possibilità di una nuova infezione.
Mi sono totalmente stravolto nel tentativo di pensarci in modi insoliti, ma mi sembra che questa concettualizzazione sia buona come quella che mi verrà in mente. Se qualcosa non ha senso, non esitare a chiedere chiarimenti. Se la mia comprensione della situazione sembra sbagliata, non esitate a dirmelo. Grazie mille per il vostro aiuto.
In risposta a Srikant: è un caso di classificazione latente (infetto da TB o meno) utilizzando i due risultati del test continuo (ma non normale e troncato). In questo momento, quella classificazione viene fatta usando un cutoff (nella sua forma semplificata, TB - zero> .35 -> positivo). Con i risultati del test presentati come (zero, TB, risultato), gli archetipi di base * sono:
Probabile negativo: (0,06, 0,15, -) (0,24, 0,23, -) (0,09, 0,11, -) (0,16, 0,15, -)
Probabile positivo: (0,05, 3,75, +) (0,05, 1,56, +) (0,06 , 5,02, +) (0,08, 4,43, +)
Wobbler: (0,05, 0,29, -) (0,09, 0,68, +) (0,08, 0,31, -) (0,07, 0,28, -)
Il lato positivo del secondo test per Wobbler è chiaramente un'aberrazione, ma come lo modelleresti? Mentre una linea del mio pensiero è quella di stimare la "vera differenza" tra TB e zero in ogni momento usando un modello multilivello a misure ripetute, mi è venuto in mente che quello che voglio veramente sapere è se la risposta nulla della persona e la risposta TB vengono estratti dalla stessa distribuzione o se il loro sistema immunitario riconosce gli antigeni della tubercolosi e si attiva, producendo una risposta aumentata.
Quanto a ciò che potrebbe causare un test positivo diverso dall'infezione: non ne sono sicuro. Sospetto che in genere si tratti solo di una variazione interpersonale dei risultati, ma c'è sicuramente la possibilità di altri fattori. Abbiamo dei questionari per ogni momento, ma non li ho ancora esaminati troppo.
* Dati fabbricati ma illustrativi