La foresta casuale è un classificatore di apprendimento automatico basato sulla scelta di sottoinsiemi casuali di variabili per ciascun albero e utilizzando l'output dell'albero più frequente come classificazione generale.
Una foresta casuale (RF) è creata da un insieme di Decision Trees (DT). Utilizzando il bagging, ogni DT viene addestrato in un sottoinsieme di dati diverso. Quindi, esiste un modo per implementare una foresta casuale in linea aggiungendo ulteriori decisioni su nuovi dati? Ad esempio, abbiamo 10K campioni e addestriamo …
Stavo cercando di usare le importazioni delle funzionalità dalle foreste casuali per eseguire alcune selezioni empiriche di funzionalità per un problema di regressione in cui tutte le funzionalità sono categoriche e molte hanno molti livelli (dell'ordine di 100-1000). Dato che la codifica one-hot crea una variabile fittizia per ogni livello, …
Ho tracciato l'importanza delle funzionalità in foreste casuali con scikit-learn . Al fine di migliorare la previsione utilizzando foreste casuali, come posso utilizzare le informazioni sulla trama per rimuovere le funzionalità? Vale a dire come individuare se una funzione è inutile o, se non peggio, diminuisce le prestazioni delle foreste …
Esistono delle regole empiriche (o regole effettive) relative alla quantità minima, massima e "ragionevole" di celle LSTM che dovrei usare? In particolare mi riferisco a BasicLSTMCell di TensorFlow e num_unitsproprietà. Si prega di supporre che ho un problema di classificazione definito da: t - number of time steps n - …
Sto prototipando un'applicazione e ho bisogno di un modello linguistico per calcolare la perplessità su alcune frasi generate. Esiste un modello di linguaggio addestrato in Python che posso usare facilmente? Qualcosa di semplice come model = LanguageModel('en') p1 = model.perplexity('This is a well constructed sentence') p2 = model.perplexity('Bunny lamp robert …
Ho appena completato l'apprendimento automatico per il corso R su cognitiveclass.ai e ho iniziato a sperimentare con foreste casuali. Ho creato un modello usando la libreria "randomForest" in R. Il modello classifica per due classi, buono e cattivo. So che quando un modello è sovralimentato, si comporta bene con i …
Dati in ingresso: -> caratteristiche della maglietta (colore, logo, ecc.)XXX YYY -> profit margin I have trained a random forest on the above XXX and YYY and have achieved reasonable accuracy on a test data. So, I have P(Y|X)P(Y|X)P(Y|X). Now, I would like to find P(X|Y)P(X|Y)P(X|Y) i.e probability distribution of …
Ho un set di dati che ha un attributo di classe binaria. Ci sono 623 casi con classe +1 (positivo al cancro) e 101.671 casi con classe -1 (negativo al cancro). Ho provato vari algoritmi (Naive Bayes, Random Forest, AODE, C4.5) e tutti hanno inaccettabili rapporti di falsi negativi. Random …
Voglio evitare il sovradimensionamento nella foresta casuale. A questo proposito, intendo utilizzare mtry, nodesize, maxnodi ecc. Potreste aiutarmi, per favore, a scegliere i valori per questi parametri? Sto usando R. Inoltre, se possibile, per favore dimmi come posso usare la validazione incrociata di k-fold per la foresta casuale (in R).
Devo trovare l'accuratezza di un set di dati di allenamento applicando l'algoritmo casuale della foresta. Ma i miei tipi di set di dati sono sia categorici che numerici. Quando ho provato ad adattare quei dati, ho ricevuto un errore. 'Input contiene NaN, infinito o un valore troppo grande per dtype …
Vorrei eseguire un modello di apprendimento automatico come foresta casuale, aumento del gradiente o SVM sul mio set di dati. Ci sono più di 200 variabili predittive nel mio set di dati e le mie classi target sono una variabile binaria. Devo eseguire la selezione delle funzioni prima dell'adattamento del …
Chiuso . Questa domanda deve essere più focalizzata . Al momento non accetta risposte. Vuoi migliorare questa domanda? Aggiorna la domanda in modo che si concentri su un problema solo modificando questo post . Chiuso 5 anni fa . Sembra che la maggior parte delle lingue abbia un certo numero …
Chiuso . Questa domanda deve essere più focalizzata . Al momento non accetta risposte. Vuoi migliorare questa domanda? Aggiorna la domanda in modo che si concentri su un problema solo modificando questo post . Chiuso 4 anni fa . Sto lavorando a un progetto e ho difficoltà a decidere quale …
Lasso applicato per classificare le caratteristiche e ottenere i seguenti risultati: rank feature prob. ================================== 1 a 0.1825477951589229 2 b 0.07858498115577893 3 c 0.07041793111843796 Si noti che il set di dati ha 3 etichette. La classifica delle caratteristiche per le diverse etichette è la stessa. Quindi ha applicato la foresta …
Ho addestrato un modello di previsione con Scikit Learn in Python (Random Forest Regressor) e voglio estrarre in qualche modo i pesi di ogni funzione per creare uno strumento eccellente per la previsione manuale. L'unica cosa che ho trovato è il model.feature_importances_ma non aiuta. C'è un modo per raggiungerlo? def …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.