La probabilità prevista della regressione logistica può essere interpretata come la fiducia nella classificazione


12

Possiamo interpretare la probabilità posteriore ottenuta da un classificatore che genera un valore di classe previsto e una probabilità (ad esempio, regressione logistica o Naive Bayes) come una sorta di punteggio di confidenza assegnato a quel valore di classe previsto?

Risposte:


8

Come affermano correttamente altre risposte, le probabilità riportate da modelli come la regressione logistica e Bayes ingenui sono stime della probabilità di classe. Se il modello fosse vero, la probabilità sarebbe effettivamente la probabilità di una corretta classificazione.

Tuttavia, è abbastanza importante capire che ciò potrebbe essere fuorviante perché il modello è stimato e quindi non un modello corretto. Ci sono almeno tre problemi.

  • Incertezza delle stime.
  • Errata specifica del modello.
  • Bias.

L' incertezza è solo il fatto presente ovunque che la probabilità è solo una stima. Un intervallo di confidenza della probabilità di classe stimata potrebbe fornire qualche idea sull'incertezza (della probabilità di classe, non della classificazione).

--

Se la procedura di stima (intenzionalmente) fornisce una stima distorta , le probabilità della classe sono errate. Questo è qualcosa che vedo con metodi di regolarizzazione come il lazo e la cresta per la regressione logistica. Mentre una scelta cross-validata della regolarizzazione porta a un modello con buone prestazioni in termini di classificazione, le probabilità di classe risultanti sono chiaramente sottovalutate (troppo vicine allo 0,5) in casi di test. Questo non è necessariamente negativo, ma importante essere consapevoli.


2

Per un banco di prova (ingresso particolare), sua classe (diciamo l'etichetta 1 per l'uscita binaria) probabilità predittiva è la possibilità dell'esempio prova appartiene a tale classe. In molti di questi casi di test, la proporzione appartenente alla classe 1 tenderà alla probabilità predittiva. La fiducia ha connotazioni di intervalli di confidenza, che sono qualcosa di molto diverso.


1

Se un classificatore prevede una certa classe con una probabilità, quel numero può essere usato come proxy per il grado di confidenza in quella classificazione. Da non confondere con gli intervalli di confidenza. Ad esempio, se il classificatore P prevede due casi come +1 e -1 con probabilità 80% e 60%, è corretto affermare che è più sicuro della classificazione +1 che della classificazione -1. La varianza misurata da p (1-p) è anche una buona misura di incertezza. Nota, la sicurezza di base è del 50% e non di 0.


1

Dato un classificatore con 2 classi (ad esempio un discriminante lineare a 2 classi o un classificatore di regressione logistica) il valore discriminante per entrambe le classi può essere applicato a una funzione di softmax per produrre una stima della probabilità posteriore per quella classe:

P1 = exp (d1) / (exp (d1) + exp (d2))

Dove P1 è la stima della probabilità posteriore per la classe 1, d1 e d2 sono valori discriminanti rispettivamente per le classi 1 e 2. In questo caso la probabilità posteriore stimata per una data classe può essere considerata come un grado di confidenza nella classe, per un dato caso poiché P1 sarà uguale a 1 - P2.


1
Questa risposta sembra equiparare la "probabilità" alla "fiducia", mentre la risposta di @ Yoda (correttamente) distingue i due.
whuber

@whuber Penso che in termini generali la fiducia possa essere vista come forza di credo. In questo modo è come una probabilità. La fiducia e l'intervallo di confidenza sono due cose diverse. Tuttavia, anche per il termine intervallo di confidenza il livello di confidenza è una probabilità di copertura per l'intervallo casuale.
Michael R. Chernick,

Non sono in disaccordo con le tue osservazioni, @Michael, nel senso che un termine come "punteggio di fiducia" potrebbe significare quasi tutto (ma forse il suo uso dovrebbe essere deprecato proprio per questo motivo). Tuttavia, in che senso il valore della regressione logistica è una "probabilità di copertura"? L'uso proposto della "fiducia" come forza di convinzione la rende sinonimo di "probabilità" soggettiva o viene ancora mantenuta una certa distinzione? (Se sì, cosa?)
whuber

1
@whuber Penso che tu stia andando molto più in profondità in questo rispetto a quello che intendevo con la mia osservazione. Voglio solo dire che solo perché colleghiamo comunemente la parola "confidenza" con l'intervallo di confidenza, ciò non significa che il punteggio di confidenza del termine PO non possa essere usato per indicare una probabilità (forse come la visione bayesiana della probabilità come livello soggettivo di convinzione ma non necessariamente).
Michael R. Chernick,

1
@whuber, in effetti mi riferivo alla fiducia nell'etichetta di classe nel senso di "forza di credo", cioè maggiore è il valore di probabilità posteriore per una data classe, maggiore è la fiducia che hai nell'etichetta di classe prevista. Sono felice di rimuovere questa risposta comunque.
BGreene,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.