La mia comprensione è che la foresta casuale sceglie casualmente le variabili mtry per costruire ogni albero decisionale. Quindi, se mtry = ncol / 3, ogni variabile verrà utilizzata in media in 1/3 degli alberi. E 2/3 degli alberi non li useranno.
Ma cosa succede se so che una singola variabile è probabilmente molto importante, sarebbe bene aumentare manualmente la probabilità che questa variabile venga raccolta in ogni albero? È possibile con il pacchetto randomForest in R?