La sensibilità o la specificità sono una funzione di prevalenza?


10

L'insegnamento standard afferma che la sensibilità e la specificità sono proprietà del test e sono indipendenti dalla prevalenza. Ma questo non è solo un presupposto?

I principi di Harrison di medicina interna diciannovesima edizione dicono

È stato a lungo affermato che la sensibilità e la specificità sono parametri di accuratezza del test indipendenti dalla prevalenza e molti testi fanno ancora questa affermazione. Questa ipotesi statisticamente utile, tuttavia, è clinicamente semplicistica. ... la sensibilità del test sarà probabilmente più alta nei pazienti ospedalizzati e la specificità del test più alta nei pazienti ambulatoriali.

(La prevalenza è in genere più elevata nei pazienti ricoverati rispetto ai pazienti ambulatoriali)

Esiste una relazione matematica o grafica approssimativa tra questi parametri?

Anche questo link lo definisce una "semplificazione". Perché?

Modifica: so come viene definita la sensibilità. Non è previsto alcun termine di prevalenza, come indicato nelle risposte. Io stesso ho sostenuto che queste sono proprietà del test non influenzate dalla popolazione utilizzata, fino a quando non ho incontrato questa affermazione, quindi la domanda. Ma suppongo che questa confusione non sia dovuta alla definizione ma al calcolo pratico di questi valori. Specificità e sensibilità sono calcolate usando tabelle 2x2, la prevalenza della popolazione di riferimento qui conta? È quello a cui si riferiscono? In tal caso, qual è la funzione?

Risposte:


4

Sebbene le risposte di @ Tim ♦ e @ gung ♦ coprano praticamente tutto, cercherò di sintetizzarle entrambe in una singola e fornire ulteriori chiarimenti.

Il contesto delle righe citate potrebbe riferirsi principalmente a test clinici sotto forma di una certa soglia, come è più comune. Immagina una malattia , e tutto tranne incluso lo stato di salute indicato come . Per il nostro test, vorremmo trovare alcune misure proxy che ci consentano di ottenere una buona previsione per (1) Il motivo per cui non otteniamo specificità / sensibilità assoluta è che i valori della nostra quantità proxy non sono perfettamente correlati con lo stato della malattia, ma solo generalmente associato ad esso, e quindi, nelle singole misurazioni, potremmo avere la possibilità che quella quantità superi la nostra soglia perD D c D D cDDDcDDcindividui e viceversa. Per motivi di chiarezza, assumiamo un modello gaussiano per la variabilità.

Diciamo che stiamo usando come quantità proxy. Se è stato scelto , allora deve essere maggiore di ( è l'operatore del valore atteso). Ora il problema sorge quando ci si rende conto che è una situazione composito (così è ), in realtà costituito da 3 gradi di gravità , , , ciascuno con un valore progressivamente crescente atteso per . Per un singolo individuo, selezionato dalla categoria o dallax E [ x D ] E [ x D c ] E D D c D 1 D 2 D 3 x D D c x T D D c x T D x D cxxE[xD]E[xDc]EDDcD1D2D3xDDccategoria, le probabilità che il "test" diventi positivo o meno dipenderanno dal valore di soglia che scegliamo. Diciamo che scegliamo sulla base dello studio di un campione veramente casuale con individui e . Il nostro causerà alcuni falsi positivi e negativi. Se selezioniamo una persona modo casuale, la probabilità che governa il suo valore se data dal grafico verde e quella di una persona scelta casualmente dal grafico rosso.xTDDcxTDxDcinserisci qui la descrizione dell'immagine

I numeri effettivi ottenuti dipenderanno dai numeri effettivi degli individui e ma la specificità e la sensibilità risultanti no. Sia una funzione di probabilità cumulativa. Quindi, per la prevalenza di della malattia , ecco una tabella 2x2 come ci si aspetterebbe dal caso generale, quando proviamo a vedere effettivamente come si comporta il nostro test nella popolazione combinata.D c F ( ) p DDDcF()pD

(D,+)=p(1FD(xT))
(Dc,)=(1p)(1FDc(xT))
(D,)=p(FD(xT))
(Dc,+)=(1p)FDc(xT)

I numeri effettivi dipendono da , ma sensibilità e specificità sono indipendenti. Ma entrambi dipendono da e . Quindi, tutti i fattori che influenzano questi, cambieranno sicuramente queste metriche. Se, ad esempio, lavorassimo in terapia intensiva, il nostro verrebbe invece sostituito da e se parliamo di pazienti ambulatoriali, sostituito da . È una questione separata che in ospedale anche la prevalenza sia diversa,p F D F D c F D F D 3 F D 1 D c D c x D D c F D F D c D F FppFDFDcFDFD3FD1ma non è la diversa prevalenza che sta causando differenze di sensibilità e specificità, ma la diversa distribuzione, poiché il modello su cui è stata definita la soglia non era applicabile alla popolazione che appare come ambulatoriale o ricoverato . Puoi andare avanti e scomporre in più sottopopolazioni, poiché la sottoparte ospedaliera di avrà anche un alzato per altri motivi (poiché la maggior parte dei proxy sono anche "elevati" in altre condizioni gravi). La rottura della popolazione nella sottopopolazione spiega il cambiamento di sensibilità, mentre quello della popolazione spiega il cambiamento di specificità (mediante corrispondenti cambiamenti in eDcDcxDDcFDFDc ). Questo è ciò che comprende effettivamente il grafico composito . Ognuno dei colori avrà effettivamente la propria , e quindi, fintanto che differisce dalla su cui sono stati calcolati la sensibilità e la specificità originali, queste metriche cambieranno.DFF

inserisci qui la descrizione dell'immagine

Esempio

Assumi una popolazione di 11550 con 10000 Dc, 500,750,300 D1, D2, D3 rispettivamente. La parte commentata è il codice utilizzato per i grafici sopra.

set.seed(12345)
dc<-rnorm(10000,mean = 9, sd = 3)
d1<-rnorm(500,mean = 15,sd=2)
d2<-rnorm(750,mean=17,sd=2)
d3<-rnorm(300,mean=20,sd=2)
d<-cbind(c(d1,d2,d3),c(rep('1',500),rep('2',750),rep('3',300)))
library(ggplot2)
#ggplot(data.frame(dc))+geom_density(aes(x=dc),alpha=0.5,fill='green')+geom_density(data=data.frame(c(d1,d2,d3)),aes(x=c(d1,d2,d3)),alpha=0.5, fill='red')+geom_vline(xintercept = 13.5,color='black',size=2)+scale_x_continuous(name='Values for x',breaks=c(mean(dc),mean(as.numeric(d[,1])),13.5),labels=c('x_dc','x_d','x_T'))

#ggplot(data.frame(d))+geom_density(aes(x=as.numeric(d[,1]),..count..,fill=d[,2]),position='stack',alpha=0.5)+xlab('x-values')

Possiamo facilmente calcolare i mezzi x per le varie popolazioni, tra cui Dc, D1, D2, D3 e il composito D.

mean(dc) 
mean(d1) 
mean(d2) 
mean(d3) 
mean(as.numeric(d[,1]))

> mean(dc) [1] 8.997931
> mean(d1) [1] 14.95559
> mean(d2) [1] 17.01523
> mean(d3) [1] 19.76903
> mean(as.numeric(d[,1])) [1] 16.88382

Per ottenere una tabella 2x2 per il nostro caso di test originale, abbiamo prima impostato una soglia, in base ai dati (che in un caso reale verrebbero impostati dopo aver eseguito il test come mostra @gung). Ad ogni modo, ipotizzando una soglia di 13,5, otteniamo la seguente sensibilità e specificità quando calcolati sull'intera popolazione.

sdc<-sample(dc,0.1*length(dc)) 
sdcomposite<-sample(c(d1,d2,d3),0.1*length(c(d1,d2,d3))) 
threshold<-13.5 
truepositive<-sum(sdcomposite>13.5) 
truenegative<-sum(sdc<=13.5) 
falsepositive<-sum(sdc>13.5) 
falsenegative<-sum(sdcomposite<=13.5) 
print(c(truepositive,truenegative,falsepositive,falsenegative)) 
sensitivity<-truepositive/length(sdcomposite) 
specificity<-truenegative/length(sdc) 
print(c(sensitivity,specificity))

> print(c(truepositive,truenegative,falsepositive,falsenegative)) [1]139 928  72  16
> print(c(sensitivity,specificity)) [1] 0.8967742 0.9280000

Supponiamo che stiamo lavorando con i pazienti ambulatoriali e riceviamo pazienti malati solo dalla proporzione D1, o stiamo lavorando in terapia intensiva dove riceviamo solo D3. (per un caso più generale, dobbiamo dividere anche il componente Dc) Come cambiano la nostra sensibilità e specificità? Modificando la prevalenza (ovvero cambiando la proporzione relativa dei pazienti appartenenti a entrambi i casi, non cambiamo affatto la specificità e la sensibilità. Accade solo che questa prevalenza cambi anche con il cambiamento della distribuzione)

sdc<-sample(dc,0.1*length(dc)) 
sd1<-sample(d1,0.1*length(d1)) 
truepositive<-sum(sd1>13.5) 
truenegative<-sum(sdc<=13.5) 
falsepositive<-sum(sdc>13.5) 
falsenegative<-sum(sd1<=13.5) 
print(c(truepositive,truenegative,falsepositive,falsenegative)) 
sensitivity1<-truepositive/length(sd1) 
specificity1<-truenegative/length(sdc) 
print(c(sensitivity1,specificity1)) 
sdc<-sample(dc,0.1*length(dc)) 
sd3<-sample(d3,0.1*length(d3)) 
truepositive<-sum(sd3>13.5) 
truenegative<-sum(sdc<=13.5) 
falsepositive<-sum(sdc>13.5) 
falsenegative<-sum(sd3<=13.5) 
print(c(truepositive,truenegative,falsepositive,falsenegative)) 
sensitivity3<-truepositive/length(sd3) 
specificity3<-truenegative/length(sdc) 
print(c(sensitivity3,specificity3))

> print(c(truepositive,truenegative,falsepositive,falsenegative)) [1]  38 931  69  12
> print(c(sensitivity1,specificity1)) [1] 0.760 0.931
> print(c(truepositive,truenegative,falsepositive,falsenegative)) [1]  30 944  56   0
> print(c(sensitivity3,specificity3)) [1] 1.000 0.944

Riassumendo, un diagramma per mostrare il cambiamento di sensibilità (la specificità avrebbe seguito una tendenza simile se avessimo composto anche la popolazione Dc dalle sottopopolazioni) con una x media variabile per la popolazione, ecco un grafico

df<-data.frame(V1=c(sensitivity,sensitivity1,sensitivity3),V2=c(mean(c(d1,d2,d3)),mean(d1),mean(d3))) 
ggplot(df)+geom_point(aes(x=V2,y=V1),size=2)+geom_line(aes(x=V2,y=V1))

inserisci qui la descrizione dell'immagine

  1. Se non è proxy, avremmo tecnicamente una specificità e sensibilità al 100%. Supponiamo, ad esempio, che definisca un particolare quadro patologico oggettivamente definito su Biopsia epatica, quindi il test Biopsia epatica diventerà il gold standard e la nostra sensibilità verrebbe misurata contro se stessa e quindi produrrebbe un 100%D

9

Innanzitutto, vale la pena riconoscere che in genere non è possibile modificare la sensibilità indipendentemente dalla specificità e viceversa. Questo è il punto di una curva ROC. Data la natura del processo di generazione dei dati e i tuoi dati e modello specifici, rimarrai sempre bloccato con un certo compromesso tra sensibilità e specificità. Ovviamente preferiresti avere la sensibilità al 100% e la specificità al 100% allo stesso tempo, ma in genere non puoi. È possibile ottenere una migliore sensibilità, ma a scapito di una specificità peggiore, o una migliore specificità, ma a scapito della peggiore sensibilità. La curva ROC mostra l'insieme di compromessi tra cui sei costretto a scegliere. (Un paio di note: 1. a volte puoi sembrare di guadagnare su una dimensione senza perdere nulla sull'altra perché c'è un gap nel tuo set di dati, ma questo è per lo più illusorio; 2.La curva ROC è la sensibilità in funzione della specificità 1, la rappresentazione della sensibilità rispetto alla specificità stessa sarebbe una curva ROC riflessa.)

inserisci qui la descrizione dell'immagine

Ad ogni modo, come potrebbe l'apparente sensibilità e specificità cambiare con prevalenza? Questo è un problema in cui aiuta a simulare e giocare con alcuni dati per vedere come questo può funzionare in pratica. Immaginiamo che un modello sia adatto a un set di dati abbastanza grande che abbia una prevalenza particolare e che sia impostata una soglia sull'asse x 1 . Successivamente, le prestazioni di questo test vengono calcolate con campioni che hanno prevalenze sostanzialmente diverse (e quindi valori x diversi). Il risultato è che lo stesso modello, utilizzando la stessa soglia, avrà prestazioni diverse se applicato a set di dati con prevalenze diverse.

library(caret)  # we'll use these packages
library(binom)
  # we'll use this function to convert log odds to probabilities
lo2p = function(lo){ exp(lo)/(1+exp(lo)) }

##### training dataset for original model
set.seed(734)                     # these make the examples exactly reproducible
Nt = 1000
xt = rnorm(Nt, mean=5, sd=1)      # this is the distribution of X
lo = -1.386 + .308*xt             # this is the data generating process
pt = lo2p(lo)
yt = rbinom(Nt, size=1, prob=pt)
mt = glm(yt~xt, family=binomial)
summary(mt)
# ...
# Coefficients:
#             Estimate Std. Error z value Pr(>|z|)    
# (Intercept) -1.16736    0.32794  -3.560 0.000371 ***
# xt           0.24980    0.06429   3.886 0.000102 ***
# ...
#     Null deviance: 1384.5  on 999  degrees of freedom
# Residual deviance: 1369.1  on 998  degrees of freedom
# AIC: 1373.1

## determine threshold
# prob(Y) = 50%, where log odds = 0, so:
-coef(mt)[1]/coef(mt)[2]  # 4.673159
threshold = 4.7  # a simple round number
classt    = ifelse(xt>threshold, 1, 0)
tabt      = table(classt, yt)[2:1,2:1]

confusionMatrix(tabt)
#       yt
# classt   1   0
#      1 346 279
#      0 175 200
#                                           
#                Accuracy : 0.546           
#                     ...                                          
#             Sensitivity : 0.6641          
#             Specificity : 0.4175          
#          Pos Pred Value : 0.5536          
#          Neg Pred Value : 0.5333          
#              Prevalence : 0.5210          


##### high prevalence dataset from hospital
set.seed(4528)
Nh = 500
xh = rnorm(Nh, mean=6, sd=1)  # a different distribution of X
lo = -1.386 + .308*xh         # but the same data generating process
ph = lo2p(lo)
yh = rbinom(Nh, size=1, prob=ph)
classh = ifelse(xh>threshold, 1, 0)  # the same threshold is used
tabh   = table(classh, yh)[2:1,2:1]

confusionMatrix(tabh)
#       yh
# classh   1   0
#      1 284 163
#      0  20  33
#                                           
#                Accuracy : 0.634           
#                     ...
#             Sensitivity : 0.9342          
#             Specificity : 0.1684          
#          Pos Pred Value : 0.6353          
#          Neg Pred Value : 0.6226          
#              Prevalence : 0.6080          


##### low prevalence dataset from outpatients
set.seed(1027)
Nl = 500
xl = rnorm(Nl, mean=3, sd=1)
lo = -1.386 + .308*xl
pl = lo2p(lo)
yl = rbinom(Nl, size=1, prob=pl)
classl = ifelse(xl>threshold, 1, 0)
tabl   = table(classl, yl)[2:1,2:1]

confusionMatrix(tabl)
#       yl
# classl   1   0
#      1   9  14
#      0 190 287
#                                           
#                Accuracy : 0.592           
#                     ...
#             Sensitivity : 0.04523         
#             Specificity : 0.95349         
#          Pos Pred Value : 0.39130         
#          Neg Pred Value : 0.60168         
#              Prevalence : 0.39800         


##### sensitivities
binom.confint(346, 521, method="e")
#   method   x   n      mean     lower    upper
# 1  exact 346 521 0.6641075 0.6217484 0.704592
binom.confint(284, 304, method="e")
#   method   x   n      mean   lower     upper
# 1  exact 284 304 0.9342105 0.90022 0.9593543
binom.confint(  9, 199, method="e")
#   method x   n       mean      lower      upper
# 1  exact 9 199 0.04522613 0.02088589 0.08411464

##### specificities
binom.confint(200, 479, method="e")
#   method   x   n      mean     lower     upper
# 1  exact 200 479 0.4175365 0.3729575 0.4631398
binom.confint( 33, 196, method="e")
#   method  x   n      mean     lower     upper
# 1  exact 33 196 0.1683673 0.1188206 0.2282441
binom.confint(287, 301, method="e")
#   method   x   n      mean     lower     upper
# 1  exact 287 301 0.9534884 0.9231921 0.9743417

Ecco le sensibilità e le specificità in funzione delle prevalenze, con intervalli di confidenza esatti al 95%:

inserisci qui la descrizione dell'immagine

Quindi cosa sta succedendo qui? Considera che una regressione logistica prototipica potrebbe assomigliare alla figura seguente. Si noti che tutta l '"azione" si sta verificando nell'intervallo [4, 6] sull'asse x. I dati che seguono avranno una prevalenza molto bassa e il modello mostrerà scarsa discriminazione e sensibilità. I dati al di sopra di tale intervallo avranno una prevalenza molto elevata, ma il modello non discriminerà bene e avrà una scarsa specificità.

inserisci qui la descrizione dell'immagine

Per aiutare a capire come ciò potrebbe accadere, prendere in considerazione il test dell'alanina transaminasi per determinare se il fegato del paziente non sta funzionando 2. L'idea è che il fegato normalmente usa ALT, ma che se il fegato ha smesso di funzionare, ALT verrà scaricato nel flusso sanguigno. Quindi, se il livello di ALT nel flusso sanguigno di un paziente è al di sopra di una certa soglia, ciò implica che il fegato sta fallendo. Se si preleva un campione con un'alta prevalenza di insufficienza epatica, verrà prelevato un campione con alti livelli di ALT nel sangue. Pertanto, avrai più pazienti al di sopra della soglia. Non tutte le persone con alti livelli ematici di ALT avranno insufficienza epatica - per alcuni pazienti ci sarà qualche altra causa. Ma quelli con insufficienza epatica dovrebbero essere catturati. Questo porta ad una maggiore sensibilità. Allo stesso modo, non tutti i pazienti con livelli normali di ALT hanno fegati sani, ma un campione con bassa prevalenza avrà livelli più bassi di ALT e più pazienti supereranno il test. Coloro i cui fegati non sono t fallendo, ma chi ha livelli normali di ALT ci mancherà. Ciò porta a una sensibilità inferiore, ma una specificità più elevata.

Più in generale, l'idea di un test medico è che qualcosa o l'altro è correlato a uno stato patologico di cui potresti avere misure dirette, ma che non puoi. Ottenere una misura del correlato ti dà un'idea dello stato della malattia. Un test (potenziale) in cui questo non è vero non avrebbe alcun valore e non verrebbe utilizzato. Pertanto, in pratica, i campioni con prevalenza più elevata dovrebbero avere una distribuzione del correlato con valori più anormali che portano a una maggiore sensibilità e viceversa. (Si noti che il correlato non deve essere una causa della malattia; nell'esempio ALT, è un effetto, in altri esempi, sia la malattia che il correl potrebbero essere effetti di una causa comune, ecc.)

1. Questo è in realtà abbastanza comune in medicina. Considera che il colesterolo dovrebbe essere <200, la pressione sistolica dovrebbe essere <140, ecc. Questi non sono in realtà "test" di per sé, ma ci sono molti test che funzionano proprio così. Per alcune discussioni (forse distanti) relative alle soglie, può essere utile leggere le mie risposte a Le soglie 0-1 sono sempre equivalenti alle soglie dell'asse x? e perché il numero di falsi positivi è indipendente dalla dimensione del campione, se utilizziamo i valori p per confrontare due set di dati indipendenti?
2. Tieni presente che non sono un medico e che questo esempio potrebbe non essere corretto. Chiedi a un vero medico se desideri informazioni accurate sulla funzionalità epatica, i relativi test e le questioni correlate.


Grazie! Per aver dimostrato che in realtà cambia. Ma come considera la risposta di @Tim? Non è contraddittorio?
Polisetty,

1
@Polisetty, Tim afferma che "i pazienti ricoverati e ambulatoriali possono differire in molti aspetti, non solo nella prevalenza, quindi alcuni altri fattori possono influenzare la sensibilità". Se il test è una funzione di alcune proprietà dei pazienti (diciamo, colesterolo) e la malattia è fortemente correlata con quella proprietà (che è generalmente l'intero punto), allora gli "altri fattori" devono muoversi insieme la prevalenza. Pertanto, quando la prevalenza cambia, l'altra correlazione cambia e il test ha più o meno sensibilità con quel gruppo specifico.
gung - Ripristina Monica

7

Come già detto da altri, la sensibilità e la specificità non dipendono dalla prevalenza. La sensibilità è la proporzione di veri positivi tra tutti i positivi e la specificità è la proporzione di veri negativi tra tutti i negativi. Quindi, se la sensibilità è del 90%, il test sarà corretto per il 90% dei casi positivi. Ovviamente il 90% di qualcosa di più piccolo e il 90% di qualcosa di più grande è ancora il 90% ...

Quindi, dati i dati tabulari che menzioni,

positiveconditionnegativeconditionpositivetestacnegativetestbd

la sensibilità è (da la definizione di probabilità condizionale ) e la specificità è . Per ciascuna delle metriche, guardi solo una delle colonne alla volta, quindi la prevalenza (dimensioni relative delle colonne) non ha importanza per quelle metriche. La prevalenza non viene nelle equazioni. Inoltre sarebbe piuttosto strano se la sensibilità "pratica" fosse definita in modo diverso quindi teoricamente e portasse a conclusioni diverse.aa+b+c+d/a+ba+b+c+d=aa+b p(YX)=p(YX)p(X)da+b+c+d/c+da+b+c+d=dc+d

Ma la citazione sembra anche dire qualcos'altro

la sensibilità del test sarà probabilmente più alta nei pazienti ospedalizzati e la specificità del test più alta nei pazienti ambulatoriali

così gli autori affermano che la sensibilità differisce nei diversi gruppi. Immagino che pazienti ricoverati e ambulatoriali possano differire in molti aspetti, non solo nella prevalenza, quindi alcuni altri fattori possono influenzare la sensibilità. Quindi sono d'accordo sul fatto che potrebbero cambiare tra diversi set di dati, che differiscono in prevalenza, ma il cambiamento non sarà una funzione della prevalenza stessa (come mostrato da @gung nella sua risposta).

D'altra parte, se dovessi indovinare, forse gli autori confondono la sensibilità con la probabilità posteriore . La sensibilità è , mentre la probabilità posteriore èp(positive testcondition)

p(conditionpositive test)p(positive testcondition)×p(condition)

e in molti casi questa è la probabilità che le persone siano interessate ("quanto è probabile che un paziente con un risultato positivo del test abbia effettivamente la malattia?") e dipende dalla prevalenza. Si noti che anche il collegamento discute l'impatto della prevalenza sul valore predittivo positivo, cioè la probabilità posteriore, non sulla sensibilità.


Come ho detto in una delle risposte precedenti, sono abbastanza sicuro che gli autori non lo confondessero con la probabilità posteriore, poiché menzionano esplicitamente che "molti testi fanno ancora questa affermazione". E cito anche un'altra fonte, anche se non affidabile come quella di Harrison, che afferma che si tratta di una "ipotesi" sicura. Tutto quello che voglio chiedere è: qual è il "presupposto"?
Polisetty,

2
@Polisetty Non posso dire per gli autori, ma dalla citazione, sembrano chiamare l'indipendenza in prevalenza il "presupposto", ma questo è piuttosto un fatto matematico quindi presupposto. Se non reggesse, significherebbe che la teoria della probabilità è rotta e non lo è.
Tim

La sensibilità e la specificità possono essere considerate proprietà fisse di un test diagnostico. [Questa è una leggera semplificazione, ma è abbastanza buona per i nostri scopi]. - ecco cosa dice
Polisetty,

3

Vedi la mia risposta qui sui tassi vero / falso positivo / negativo.

La sensibilità è solo un altro nome per il tasso positivo reale e la specificità è la stessa del tasso negativo reale. Sia la sensibilità che la specificità sono probabilità condizionate; si condizionano sullo stato della malattia del paziente. Pertanto, la prevalenza della malattia (ovvero la probabilità a priori che un paziente abbia la malattia) è irrilevante, dal momento che si assume un particolare stato di malattia.

Non posso commentare perché l'autore del libro di testo afferma che la sensibilità e la specificità dipendono dal contesto clinico. Queste sono osservazioni empiriche?


Esattamente. Da qui la domanda. La sensibilità di un test dipende dalla popolazione dove viene utilizzata. L'ipotesi che sia indipendente non è sempre vera. Sto chiedendo come e perché. Il libro in seguito cita anche valori
Polisetty,

Potrebbero esserci fattori specifici della popolazione che influenzano la sensibilità e la specificità. Ma dalle definizioni matematiche di sensibilità e specificità risulta che la prevalenza non può essere uno di questi fattori, almeno non direttamente. (A proposito, sentiti libero di accettare la mia risposta se sei soddisfatto della mia spiegazione delle definizioni matematiche.)
tddevlin

Scusa, immagino non fosse chiaro. Volevo conoscere matematicamente la relazione tra sensibilità e prevalenza. So come sono definiti. Immagino che la relazione arrivi a causa del modo in cui sono calcolati. La sensibilità è tp / (tp + fn) mentre la prevalenza è tp + fn / (tp + fn + fp + tn)
Polisetty,

Come menziono nella mia risposta, non esiste alcuna relazione tra sensibilità e prevalenza. La prevalenza è mentre la sensibilità è . Non puoi dire nulla sul valore di uno in base al valore dell'altro. P ( + | malattia )P(Disease)P(+|disease)
tddevlin,

Harrison non sbagliare. Anche questo link lo definisce una semplificazione. med.uottawa.ca/sim/data/Sensitivity_and_Prevalence_e.htm
Polisetty

1

Ovviamente non posso parlare delle intenzioni dell'autore, ma ecco il mio ragionamento per questa affermazione:

Considera il contesto clinico come un test diagnostico stesso. Uno con una sensibilità e specificità molto scarse, ma comunque un test. Se sei in ospedale, è probabile che tu sia malato. Se non sei in ospedale, è probabile che non ti ammali.

Da questo punto di vista, l' attuale test diagnostico che si esegue è in realtà la seconda parte di due test eseguiti in serie.


Nella tua spiegazione, il priori sta cambiando portando a una maggiore probabilità posteriore. Questo è vero. Ma come cambia la sensibilità stessa è la domanda.
Polisetty,

@Polisetty Cosa succede se si definisce un alto posteriore un test positivo? "Il contesto clinico è esso stesso un test." Penso che qualsiasi test deciso arbitrariamente possa essere fatto in base alla prevalenza in questo modo, quindi il "test" deve essere definito in modo più specifico. Penso che la dichiarazione si applichi alla solita varietà di test basati su una soglia di alcune misurazioni proxy.
Satwik Pasani,

1

Questo deve essere un errore. Penso che forse l'autore stia cercando di suggerire che il valore predittivo positivo e negativo (PPV e NPV) dipendono dalla prevalenza (nonché dalla sensibilità e dalla specificità). Questi sono spesso discussi con test diagnostici e, per un medico, forse più preziosi dell'interpretazione grezza di sensibilità e specificità.

Questo grafico mostra la relazione tra PPV e NPV con prevalenza, per un test con sensibilità del 95% e specificità dell'85%.

Da Mausner JS, Kramer S: Epidemiologia di Mausner e Bahn: un testo introduttivo.  Philadelphia, WB Saunders, 1985, pag.  221.

Da Mausner JS, Kramer S: Epidemiologia di Mausner e Bahn: un testo introduttivo. Philadelphia, WB Saunders, 1985, pag. 221.


1

@Satwik, @gung e @Tim hanno già fornito molti dettagli, ma proverò ad aggiungere un piccolo esempio di come il caso dei fattori sottostanti possa causare un tale effetto.

Un principio chiave: pregiudizio

Sensibilità / Specificità e TUTTI i test statistici condividono lo stesso avvertimento: si applica solo a ripetere la stessa procedura di campionamento di prima in modo imparziale.

Gli ospedali sono organizzazioni funzionanti progettate per eseguire campionamenti di parte, usando politiche di ricovero per filtrare la popolazione generale in quelle che richiedono ricovero e cure. Questa è molto antitesi della procedura scientifica. Se vuoi sapere come funziona un test in diverse popolazioni, devi testarlo in diverse popolazioni.

L'effetto latente: correlazione

È raro (o impossibile nel mondo reale se si vuole essere severi) che una diagnosi sia indipendente / ortogonale a tutti gli altri fattori di rischio per una malattia, quindi esiste un certo grado di correlazione.

Se lo schermo per il ricovero in ospedale è positivamente correlato alla diagnostica, ciò che troverete è che le persone che superano il test di ricovero sono predisposte favorevolmente per risultati positivi dalla diagnosi, proporzionale alla correlazione. Pertanto i veri positivi si arricchiscono e i falsi negativi vengono ridotti di quantità proporzionali alla correlazione.

Questo fa apparire la sensibilità più grande.

La spiegazione del fenomeno

Un'osservazione che la sensibilità può essere più elevata in un contesto ospedaliero non è quindi irrealistica. In effetti, se la politica di ammissione è ben studiata e adatta allo scopo, ci si aspetterebbe che ciò accada.

Non è la prova di una rottura nell'ipotesi che la sensibilità e la specificità siano indipendenti dalla prevalenza, piuttosto è la prova di un campionamento parziale basato sulla politica di ricovero ospedaliero.

Che, dato un ospedale, è lì per curare le persone e non per fare esperimenti scientifici, è sicuramente una buona cosa.

Ma fa venire mal di testa agli scienziati.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.