Ho un problema di regressione multi-output con input e output . Gli output hanno una struttura di correlazione complessa, non lineare.dXdXd_xdydyd_y Vorrei usare foreste casuali per fare la regressione. Per quanto ne so, le foreste casuali per la regressione funzionano solo con un singolo output, quindi dovrei addestrare foreste casuali …
Non sono nemmeno sicuro che la domanda abbia molto senso, ma penso di aver visto un paio di titoli di articoli in cui proponevano foreste casuali con effetti casuali. È possibile in R?
Il pacchetto randomForest di R non può gestire il fattore con più di 32 livelli. Quando riceve più di 32 livelli, emette un messaggio di errore: Impossibile gestire i predittori categorici con più di 32 categorie. Ma i dati che ho hanno diversi fattori. Alcuni di essi hanno più di …
Questa domanda è stata migrata dallo Stack Overflow perché è possibile rispondere su Convalida incrociata. Migrato 5 anni fa . Ho letto altri argomenti sui diagrammi di dipendenza parziale e la maggior parte di essi riguarda il modo in cui li complottate con pacchetti diversi, non come interpretarli accuratamente, quindi: …
Stavo leggendo il rapporto sulla soluzione vincente di una competizione Kaggle ( Classificazione malware ). Il rapporto può essere trovato in questo post del forum . Il problema era un problema di classificazione (nove classi, la metrica era la perdita logaritmica) con 10000 elementi nel set di treni, 10000 elementi …
È possibile controllare il costo dell'errata classificazione nel pacchetto R randomForest ? Nel mio lavoro, i falsi negativi (ad esempio, la mancanza di errori che una persona potrebbe avere una malattia) sono molto più costosi dei falsi positivi. Il pacchetto rpart consente all'utente di controllare i costi di classificazione errata …
Ho eseguito un modello di regressione OLS su set di dati con 5 variabili indipendenti. Le variabili indipendenti e la variabile dipendente sono entrambe continue e correlate in modo lineare. La R Square è di circa il 99,3%. Ma quando eseguo lo stesso utilizzo della foresta casuale in R, il …
Sono un po 'nuovo nel datamining / machine learning / ecc. e ho letto un paio di modi per combinare più modelli ed esecuzioni dello stesso modello per migliorare le previsioni. La mia impressione dalla lettura di un paio di articoli (che sono spesso interessanti e ottimi per la teoria …
Non sono un esperto di foreste casuali ma capisco chiaramente che il problema chiave con la foresta casuale è la generazione di alberi (casuali). Puoi spiegarmi come vengono generati gli alberi? (ovvero qual è la distribuzione utilizzata per la generazione di alberi?) Grazie in anticipo !
Vorrei sapere se ci sono alcuni / alcuni vantaggi dell'utilizzo del campionamento stratificato anziché del campionamento casuale, quando si divide il set di dati originale in training e set di test per la classificazione. Inoltre, il campionamento stratificato introduce più distorsioni nel classificatore rispetto al campionamento casuale? L'applicazione, per la …
Sto sperimentando foreste casuali con scikit-learn e sto ottenendo grandi risultati dal mio set di allenamento, ma risultati relativamente scarsi sul mio set di test ... Ecco il problema (ispirato al poker) che sto cercando di risolvere: date le carte coperte del giocatore A, le carte coperte del giocatore B …
Se ho capito bene, in un algoritmo di apprendimento automatico, il modello deve imparare dalla sua esperienza, ovvero quando il modello fornisce una previsione errata per i nuovi casi, deve adattarsi alle nuove osservazioni e, nel tempo, il modello diventa sempre più migliore . Non vedo che la regressione logistica …
Le foreste casuali vengono utilizzate per la regressione. Tuttavia, da quello che ho capito, assegnano un valore target medio ad ogni foglia. Dato che ci sono solo foglie limitate in ogni albero, ci sono solo valori specifici che il target può raggiungere dal nostro modello di regressione. Quindi non è …
L'implementazione di ER è più efficiente ( Extreme Gradient Boostingè come aumentare il gradiente) - la differenza è importante dal punto di vista pratico? C'è un pacchetto R che li implementa. È un nuovo algoritmo che supera l'implementazione "generica" (pacchetto RandomForest da R) non solo in termini di efficienza o …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.