È possibile controllare il costo dell'errata classificazione nel pacchetto R randomForest ?
Nel mio lavoro, i falsi negativi (ad esempio, la mancanza di errori che una persona potrebbe avere una malattia) sono molto più costosi dei falsi positivi. Il pacchetto rpart consente all'utente di controllare i costi di classificazione errata specificando una matrice di perdita per ponderare diversamente le classificazioni errate. Esiste qualcosa di simile per randomForest? Dovrei, ad esempio, usare l' classwtopzione per controllare il criterio Gini?
classwt: Sì, ho scoperto che in pratica e in linea con altri utenti, i risultati non sono quelli previsti. (iii)cutoff: non sono chiaro su come utilizzarecutoffin questo caso e sarei lieto di ricevere ulteriori consigli.