Domande taggate «classification»

La classificazione statistica è il problema di identificare la sottopopolazione a cui appartengono le nuove osservazioni, in cui l'identità della sottopopolazione è sconosciuta, sulla base di una serie di dati di formazione contenenti osservazioni di cui è nota la sottopopolazione. Pertanto queste classificazioni mostreranno un comportamento variabile che può essere studiato dalle statistiche.

1
Vantaggi del campionamento stratificato vs casuale per la generazione di dati di allenamento in classificazione
Vorrei sapere se ci sono alcuni / alcuni vantaggi dell'utilizzo del campionamento stratificato anziché del campionamento casuale, quando si divide il set di dati originale in training e set di test per la classificazione. Inoltre, il campionamento stratificato introduce più distorsioni nel classificatore rispetto al campionamento casuale? L'applicazione, per la …

2
La foresta casuale è troppo adatta?
Sto sperimentando foreste casuali con scikit-learn e sto ottenendo grandi risultati dal mio set di allenamento, ma risultati relativamente scarsi sul mio set di test ... Ecco il problema (ispirato al poker) che sto cercando di risolvere: date le carte coperte del giocatore A, le carte coperte del giocatore B …

3
Apprendimento semi-supervisionato, apprendimento attivo e apprendimento profondo per la classificazione
Modifica finale con tutte le risorse aggiornate: Per un progetto, sto applicando algoritmi di apprendimento automatico per la classificazione. Sfida: dati etichettati piuttosto limitati e molti più dati senza etichetta. obiettivi: Applica una classificazione semi-supervisionata Applicare in qualche modo un processo di etichettatura semi-supervisionato (noto come apprendimento attivo) Ho trovato …



5
Classificazione del testo su larga scala
Sto cercando di fare una classificazione sui miei dati di testo. Ho 300 classes, 200 documenti di formazione per classe (quindi 60000 documents in total) e questo probabilmente porterà a dati dimensionali molto alti (potremmo guardare oltre 1 milione di dimensioni ). Vorrei eseguire i seguenti passaggi nella pipeline (solo …

10
Set di dati dei social network
Bloccato . Questa domanda e le sue risposte sono bloccate perché la domanda è fuori tema ma ha un significato storico. Al momento non accetta nuove risposte o interazioni. Sto cercando set di dati di social network (twitter, friendfeed, facebook, lastfm, ecc.) Per compiti di classificazione, preferibilmente in formato arff. …


2
Perché il classificatore di regressione della cresta funziona abbastanza bene per la classificazione del testo?
Durante un esperimento per la classificazione del testo, ho scoperto che il classificatore di cresta genera risultati che completano costantemente i test tra quei classificatori che sono più comunemente citati e applicati per attività di estrazione del testo, come SVM, NB, kNN, ecc. Tuttavia, non ho elaborato sull'ottimizzazione di ogni …

2
Classificazione dei test sui dati di squilibrio sovracampionato
Sto lavorando a dati gravemente squilibrati. In letteratura, vengono utilizzati diversi metodi per riequilibrare i dati utilizzando il ricampionamento (sovra o sottocampionamento). Due buoni approcci sono: SMOTE: Tecnica di sovracampionamento di minoranza sintetica ( SMOTE ) ADASYN: Approccio di campionamento sintetico adattivo per l'apprendimento sbilanciato ( ADASYN ) Ho implementato …


3
Quando non dovrei usare un classificatore d'ensemble?
In generale, in un problema di classificazione in cui l'obiettivo è prevedere con precisione l'appartenenza alla classe fuori campione, quando non dovrei usare un classificatore di ensemble? Questa domanda è strettamente correlata a Perché non usare sempre l'apprendimento d'insieme? . Questa domanda ci chiede perché non usiamo sempre ensemble. Voglio …



3
Confronto tra due risultati di accuratezza del classificatore per significatività statistica con t-test
Voglio confrontare l'accuratezza di due classificatori per significato statistico. Entrambi i classificatori vengono eseguiti sullo stesso set di dati. Questo mi porta a credere che dovrei usare un test t di un campione da quello che ho letto . Per esempio: Classifier 1: 51% accuracy Classifier 2: 64% accuracy Dataset …

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.