I dati organizzati in categorie discrete o * classi * possono presentare problemi per determinate analisi se il numero di osservazioni (n) appartenenti a ciascuna classe non è costante tra le classi. Classi con disugualin sono * sbilanciati *.
Comprendo che la misura f (basata su precisione e richiamo) è una stima della precisione di un classificatore. Inoltre, quando si dispone di un set di dati non bilanciato, si preferisce la misura f rispetto alla precisione . Ho una semplice domanda (che riguarda più l'uso corretto della terminologia che …
Considera una matrice di input e un'uscita binaria .XXXyyy Un modo comune per misurare le prestazioni di un classificatore è utilizzare le curve ROC. In un diagramma ROC la diagonale è il risultato che verrebbe ottenuto da un classificatore casuale. In caso di uscita sbilanciata possibile migliorare le prestazioni di …
Sto cercando di usare SMOTE per correggere lo squilibrio nel mio problema di classificazione multi-classe. Sebbene SMOTE funzioni perfettamente sul set di dati dell'iride secondo il documento della guida di SMOTE, non funziona su un set di dati simile. Ecco come appaiono i miei dati. Nota che ha tre classi …
Esempi: ho una frase nella descrizione del lavoro: "Ingegnere senior Java nel Regno Unito". Voglio usare un modello di apprendimento profondo per prevederlo in 2 categorie: English e IT jobs. Se uso il modello di classificazione tradizionale, posso solo prevedere 1 etichetta con la softmaxfunzione all'ultimo livello. Quindi, posso usare …
Vorrei eseguire una combinazione di sovracampionamento e sottocampionamento al fine di bilanciare il mio set di dati con circa 4000 clienti suddivisi in due gruppi, in cui uno dei gruppi ha una percentuale di circa il 15%. Ho esaminato SMOTE ( http://www.inside-r.org/packages/cran/DMwR/docs/SMOTE ) e ROSE ( http://cran.r-project.org/web/packages/ROSE/ ROSE.pdf ), ma …
1) Come posso modificare la soglia di classificazione (penso che sia di default 0,5) in RandomForest in sklearn? 2) come posso sottocampionare in sklearn? 3) Ho il seguente risultato dal classificatore RandomForest: [[1635 1297] [520 3624]] precision recall f1-score support class 0 0.76 0.56 0.64 2932 class 1 0.74 0.87 …
Sto cercando di costruire un modello di previsione con SVM su dati abbastanza sbilanciati. Le mie etichette / output hanno tre classi, positiva, neutra e negativa. Direi che l'esempio positivo rende circa il 10-20% dei miei dati, neutro circa il 50-60% e negativo circa il 30-40%. Sto cercando di bilanciare …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.