La soglia di decisione crea un compromesso tra il numero di positivi previsti e il numero di negativi previsti, poiché, aumentando tautologicamente, la soglia di decisione diminuirà il numero di positivi previsti e aumenterà il numero di negativi che tu prevedi.
La soglia di decisione non è un iperparametro nel senso di tuning del modello perché non cambia la flessibilità del modello.
Il modo in cui stai pensando alla parola "accorda" nel contesto della soglia di decisione è diverso da come sono sintonizzati gli iperparametri. La modifica di C e di altri iperparametri del modello modifica il modello(ad esempio, i coefficienti di regressione logistica saranno diversi), mentre la regolazione della soglia può fare solo due cose: scambiare TP per FN e FP per TN. Tuttavia, il modello rimane lo stesso, perché ciò non modifica i coefficienti. (Lo stesso vale per i modelli che non hanno coefficienti, come le foreste casuali: cambiare la soglia non cambia nulla sugli alberi.) Quindi, in senso stretto, hai ragione nel trovare il miglior compromesso tra gli errori è "tuning", ma ti sbagli nel pensare che la modifica della soglia sia collegata ad altri iperparametri del modello in un modo ottimizzato da GridSearchCV.
Detto in altro modo, cambiare la soglia di decisione riflette una tua scelta su quanti falsi positivi e falsi negativi vuoi avere. Considera l'ipotetico di impostare la soglia di decisione su un valore completamente non plausibile come -1. Tutte le probabilità sono non negative, quindi con questa soglia predirete "positivo" per ogni osservazione. Da una certa prospettiva, questo è fantastico, perché il tuo tasso di falsi negativi è 0,0. Tuttavia, anche il tuo tasso di falsi positivi è all'estremo di 1,0, quindi in questo senso la scelta della soglia a -1 è terribile.
L'ideale, ovviamente, è avere un TPR di 1,0 e un FPR di 0,0 e un FNR di 0,0. Ma questo è solitamente impossibile nelle applicazioni del mondo reale, quindi la domanda diventa "quanto FPR sono disposto ad accettare per quanto TPR?" E questa è la motivazione delle curve roc .