Supponendo una classificazione incrociata come quella mostrata di seguito (qui, per uno strumento di screening)
possiamo definire quattro misure di precisione dello screening e potere predittivo:
- Sensibilità (se), a / (a + c), ovvero la probabilità che lo schermo fornisca un risultato positivo dato che è presente la malattia;
- Specificità (sp), d / (b + d), ovvero la probabilità che lo schermo fornisca un risultato negativo dato che la malattia è assente;
- Valore predittivo positivo (PPV), a / (a + b), ovvero la probabilità di pazienti con risultati positivi del test che siano stati correttamente diagnosticati (come positivi);
- Valore predittivo negativo (VAN), d / (c + d), ovvero la probabilità di pazienti con risultati negativi del test a cui sia stata correttamente diagnosticata (come negativa).
Ogni quattro misure sono semplici proporzioni calcolate dai dati osservati. Un test statistico adeguato sarebbe quindi un test binomiale (esatto) , che dovrebbe essere disponibile nella maggior parte dei pacchetti statistici o in molti calcolatori online. L'ipotesi testata è se le proporzioni osservate differiscono significativamente da 0,5 o meno. Ho trovato, tuttavia, più interessante fornire intervalli di confidenza piuttosto che un singolo test di significatività, dal momento che fornisce informazioni sulla precisione della misurazione. Ad ogni modo, per riprodurre i risultati che hai mostrato, devi conoscere i margini totali della tua tabella a due vie (hai dato solo il PPV e il VAN come%).
Ad esempio, supponiamo di osservare i seguenti dati (il questionario CAGE è un questionario di screening per l'alcol):
quindi in R il PPV verrebbe calcolato come segue:
> binom.test(99, 142)
Exact binomial test
data: 99 and 142
number of successes = 99, number of trials = 142, p-value = 2.958e-06
alternative hypothesis: true probability of success is not equal to 0.5
95 percent confidence interval:
0.6145213 0.7714116
sample estimates:
probability of success
0.6971831
Se si utilizza SAS, è possibile consultare la Nota di utilizzo 24170: Come è possibile stimare la sensibilità, la specificità, i valori predittivi positivi e negativi, le probabilità di falsi positivi e negativi e i rapporti di probabilità? .
p±1.96×p(1−p)/n−−−−−−−−−√p=0.9751−α/2α=5
Per ulteriori riferimenti, puoi guardare
Newcombe, RG. Intervalli di confidenza bilaterale per la singola proporzione: confronto di sette metodi .
Statistics in Medicine , 17, 857-872 (1998).