La mia domanda riguarda la classificazione binaria, diciamo che separa i clienti buoni da quelli cattivi, ma non la regressione o la classificazione non binaria. In questo contesto, una foresta casuale è un insieme di alberi di classificazione. Per ogni osservazione, ogni albero vota un "sì" o "no" e il voto medio di tutti gli alberi è la probabilità finale della foresta.
La mia domanda riguarda la modifica del comportamento degli alberi sottostanti: Come possiamo modificare la funzione randomForest (del pacchetto randomForest di R) in modo che ogni albero voti un decimale anziché un sì / no binario. Per capire meglio cosa intendo per decimale, pensiamo a come funzionano gli alberi delle decisioni.
Un albero decisionale completamente sviluppato ha 1 istanza buona o 1 cattiva nei suoi nodi terminali. Supponiamo che io limiti la dimensione del nodo terminale a 100. Quindi i nodi terminali assomigliano:
Nodo1 = 80 cattivo, 20 buono
Nodo2 = 51 cattivo, 49 buono
Nodo3 = 10 cattivo, 90 buono
Nota, anche se Nodo1 e Nodo2 votano "cattivi", la loro "forza di cattiveria" è molto diversa. Questo è quello che sto cercando. Invece di farli produrre 1 o 0 (che è il comportamento predefinito) si può modificare il pacchetto R in modo che votino 80/100, 51/100, 10/100 ecc?