La soglia di decisione crea un compromesso tra il numero di positivi previsti e il numero di negativi previsti, poiché, aumentando tautologicamente, la soglia di decisione diminuirà il numero di positivi previsti e aumenterà il numero di negativi che tu prevedi.
La soglia di decisione non è un iperparametro nel senso di tuning del modello perché non cambia la flessibilità del modello.
Il modo in cui stai pensando alla parola "accorda" nel contesto della soglia di decisione è diverso da come sono sintonizzati gli iperparametri. La modifica di C e di altri iperparametri del modello modifica il modello(ad esempio, i coefficienti di regressione logistica saranno diversi), mentre la regolazione della soglia può fare solo due cose: scambiare TP per FN e FP per TN. Tuttavia, il modello rimane lo stesso, perché ciò non modifica i coefficienti. (Lo stesso vale per i modelli che non hanno coefficienti, come le foreste casuali: cambiare la soglia non cambia nulla sugli alberi.) Quindi, in senso stretto, hai ragione nel trovare il miglior compromesso tra gli errori è "tuning", ma ti sbagli nel pensare che la modifica della soglia sia collegata ad altri iperparametri del modello in un modo ottimizzato da GridSearchCV
.
Detto in altro modo, cambiare la soglia di decisione riflette una tua scelta su quanti falsi positivi e falsi negativi vuoi avere. Considera l'ipotetico di impostare la soglia di decisione su un valore completamente non plausibile come -1. Tutte le probabilità sono non negative, quindi con questa soglia predirete "positivo" per ogni osservazione. Da una certa prospettiva, questo è fantastico, perché il tuo tasso di falsi negativi è 0,0. Tuttavia, anche il tuo tasso di falsi positivi è all'estremo di 1,0, quindi in questo senso la scelta della soglia a -1 è terribile.
L'ideale, ovviamente, è avere un TPR di 1,0 e un FPR di 0,0 e un FNR di 0,0. Ma questo è solitamente impossibile nelle applicazioni del mondo reale, quindi la domanda diventa "quanto FPR sono disposto ad accettare per quanto TPR?" E questa è la motivazione delle curve roc .