Dati i tassi di vero positivo, falso negativo, puoi calcolare falso positivo, vero negativo?


Risposte:


53

C'è un po 'di confusione terminologica in questo settore. Personalmente, trovo sempre utile tornare a una matrice di confusione per pensarci. In un test di classificazione / screening, è possibile avere quattro diverse situazioni:

                      Condition: A        Not A

  Test says “A”       True positive   |   False positive
                      ----------------------------------
  Test says “Not A”   False negative  |    True negative

In questa tabella, "vero positivo", "falso negativo", "falso positivo" e "vero negativo" sono eventi (o loro probabilità). Ciò che hai quindi è probabilmente un tasso veramente positivo e un tasso falso negativo . La distinzione conta perché sottolinea che entrambi i numeri hanno un numeratore e un denominatore.

Quando le cose diventano un po 'confuse è che puoi trovare diverse definizioni di "tasso di falsi positivi" e "tasso di falsi negativi", con denominatori diversi.

Ad esempio, Wikipedia fornisce le seguenti definizioni (sembrano piuttosto standard):

  • Vero tasso positivo (o sensibilità):TPR=TP/(TP+FN)
  • Falso tasso positivo:FPR=FP/(FP+TN)
  • Vero tasso negativo (o specificità):TNR=TN/(FP+TN)

In tutti i casi, il denominatore è il totale della colonna . Questo dà anche spunto alla loro interpretazione: il vero tasso positivo è la probabilità che il test dica "A" quando il valore reale è effettivamente A (cioè, è una probabilità condizionata, condizionata al fatto che A sia vero). Questo non ti dice quanto è probabile che tu abbia ragione quando chiami “A” (cioè, la probabilità di un vero positivo, condizionata dal risultato del test essendo “A”).

Supponendo che il tasso di falsi negativi sia definito allo stesso modo, abbiamo quindi (nota che i tuoi numeri sono coerenti con questo). Tuttavia, non possiamo derivare direttamente il tasso di falsi positivi né dai tassi di positività positivi né da quelli negativi perché non forniscono informazioni sulla specificità, vale a dire come si comporta il test quando "non A" è la risposta corretta. La risposta alla tua domanda sarebbe quindi "no, non è possibile" perché non hai informazioni sulla colonna di destra della matrice di confusione.FNR=1-TPR

Vi sono tuttavia altre definizioni in letteratura. Ad esempio, Fleiss ( metodi statistici per tariffe e proporzioni ) offre quanto segue:

  • "[...] il tasso di falsi positivi [...] è la percentuale di persone, tra quelle che hanno risposto positivamente e che sono effettivamente libere dalla malattia."
  • "Il tasso di falsi negativi [...] è la percentuale di persone, tra quelle che hanno risposto negativamente al test, che hanno comunque la malattia".

(Riconosce anche le definizioni precedenti ma le considera "dispendiose di una preziosa terminologia", proprio perché hanno un rapporto diretto con sensibilità e specificità.)

Facendo riferimento alla matrice di confusione, significa che e quindi i denominatori sono i totali delle righe . È importante sottolineare che, sotto queste definizioni, i tassi di falsi positivi e falsi negativi non possono essere direttamente derivati ​​dalla sensibilità e dalla specificità del test. È inoltre necessario conoscere la prevalenza (ovvero la frequenza di A nella popolazione di interesse).F N R = F N / ( T N + F N )FPR=FP/(TP+FP)FNR=FN/(TN+FN)

Fleiss non usa né definisce le frasi "tasso negativo reale" o "tasso positivo positivo", ma se assumiamo che queste siano anche probabilità condizionali dato un particolare risultato / classificazione del test, allora @ guill11aume la risposta è quella corretta.

In ogni caso, devi fare attenzione alle definizioni perché non esiste una risposta indiscutibile alla tua domanda.


4
Molto buono (+1). Ho subito saltato su un'interpretazione, ma hai assolutamente ragione che la definizione alternativa è standard.
gui11aume,

1
@ gui11aume. Grazie! Era il mio sentimento, ma a pensarci bene, non ne sono più così sicuro. Guardando i riferimenti, potrebbe dipendere dal campo (apprendimento automatico vs. test medici).
Gala,

La mia esperienza è che quest'ultima definizione, TPR = TP / (TP + FP), FPR = FP / (TP + FP) è più standard.
travelingbones

1
Ecco una pubblicazione sulle differenze: link.springer.com/article/10.1007/s10899-006-9025-5#enumeration Nota la nuova terminologia "Test FPR" vs. "Predictive FPR"
travelingbones

8

EDIT: vedi la risposta di Gaël Laurans, che è più accurata.

Se il tuo vero tasso positivo è 0,25 significa che ogni volta che chiami un positivo, hai una probabilità di 0,75 di essere sbagliato. Questa è la tua percentuale di falsi positivi. Allo stesso modo, ogni volta che chiami un negativo, hai una probabilità di 0,25 di avere ragione, che è il tuo vero tasso negativo.


Dipende da ciò che si sta cercando di caratterizzare: il test nell'impostazione sulla conoscenza della verità in anticipo, o cercando di decidere sulla probabilità post-test appena dato i risultati in mano.
kd4ttc,

3

Nessuno se questo ha senso se "positivo" e "negativo" non hanno senso per il problema in questione. Vedo molti problemi in cui "positivo" e "negativo" sono scelte forzate arbitrarie su una variabile ordinale o continua. FP, TP, sens, spec sono utili solo per i fenomeni del tutto o niente.


Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.