È possibile controllare il costo dell'errata classificazione nel pacchetto R randomForest ?
Nel mio lavoro, i falsi negativi (ad esempio, la mancanza di errori che una persona potrebbe avere una malattia) sono molto più costosi dei falsi positivi. Il pacchetto rpart consente all'utente di controllare i costi di classificazione errata specificando una matrice di perdita per ponderare diversamente le classificazioni errate. Esiste qualcosa di simile per randomForest
? Dovrei, ad esempio, usare l' classwt
opzione per controllare il criterio Gini?
classwt
: Sì, ho scoperto che in pratica e in linea con altri utenti, i risultati non sono quelli previsti. (iii)cutoff
: non sono chiaro su come utilizzarecutoff
in questo caso e sarei lieto di ricevere ulteriori consigli.