Domande taggate «unbalanced-classes»

I dati organizzati in categorie discrete o * classi * possono presentare problemi per determinate analisi se il numero di osservazioni (n) appartenenti a ciascuna classe non è costante tra le classi. Classi con disugualin sono * sbilanciati *.







3
Qual è la causa principale del problema di squilibrio di classe?
Ultimamente ho pensato molto al "problema di squilibrio di classe" nell'apprendimento automatico / statistico e sto attingendo sempre più da un sentimento che non capisco cosa stia succedendo. Prima lasciami definire (o tentare di) definire i miei termini: Il problema dello squilibrio di classe nell'apprendimento automatico / statistico è l'osservazione …






2
Come gestire la differenza tra la distribuzione del set di test e il set di allenamento?
Penso che un'ipotesi di base dell'apprendimento automatico o della stima dei parametri sia che i dati invisibili provengano dalla stessa distribuzione dell'insieme di formazione. Tuttavia, in alcuni casi pratici, la distribuzione del set di test sarà quasi diversa dal set di training. Supponiamo che si tratti di un problema di …

3
Metriche di classificazione / valutazione per dati altamente squilibrati
Mi occupo di un problema di rilevamento delle frodi (simile al credit scoring). Pertanto, esiste una relazione fortemente squilibrata tra osservazioni fraudolente e non fraudolente. http://blog.revolutionanalytics.com/2016/03/com_class_eval_metrics_r.html offre un'ottima panoramica delle diverse metriche di classificazione. Precision and Recallo kappaentrambi sembrano essere una buona scelta: Un modo per giustificare i risultati di …


Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.