Scienza dei dati classification

1

Classificare i clienti in base a 2 funzionalità E una serie temporale di eventi

Ho bisogno di aiuto su quello che dovrebbe essere il mio prossimo passo in un algoritmo che sto progettando. A causa delle NDA, non posso rivelare molto, ma cercherò di essere generico e comprensibile. Fondamentalmente, dopo diversi passaggi negli algoritmi, ho questo: Per ogni cliente che ho e gli eventi …

12 classification clustering time-series

2

Dati sul sentiment per Emoji

Per la sperimentazione, vorremmo usare l' emoji incorporato in molti tweet come dati di verità / allenamento di base per una semplice analisi quantitativa del senitment. I tweet di solito sono troppo destrutturati per far funzionare bene la PNL. Ad ogni modo, ci sono 722 Emoji in Unicode 6.0 e …

12 machine-learning classification parsing

3

Classificazione del testo non strutturato

Classificherò documenti di testo non strutturati, vale a dire siti web di struttura sconosciuta. Il numero di classi a cui sto classificando è limitato (a questo punto, credo che non ce ne siano più di tre). Qualcuno ha un suggerimento su come potrei iniziare? L'approccio "bag of words" è possibile …

12 machine-learning classification text-mining beginner

3

Misurazione delle prestazioni di diversi classificatori con diverse dimensioni del campione

Attualmente sto usando diversi classificatori diversi su varie entità estratte dal testo, e uso la precisione / richiamo come un riepilogo di come ciascun classificatore separato si comporta in un determinato set di dati. Mi chiedo se esiste un modo significativo per confrontare le prestazioni di questi classificatori in modo …

12 classification performance

1

Qual è la differenza tra i metodi di compressione globale e universale?

Comprendo che i metodi di compressione possono essere suddivisi in due set principali: globale Locale Il primo set funziona indipendentemente dai dati che vengono elaborati, ovvero non si basano su alcuna caratteristica dei dati e quindi non è necessario eseguire alcuna preelaborazione su qualsiasi parte del set di dati (prima …

12 classification algorithms encoding

1

Quante celle LSTM dovrei usare?

Esistono delle regole empiriche (o regole effettive) relative alla quantità minima, massima e "ragionevole" di celle LSTM che dovrei usare? In particolare mi riferisco a BasicLSTMCell di TensorFlow e num_unitsproprietà. Si prega di supporre che ho un problema di classificazione definito da: t - number of time steps n - …

12 rnn machine-learning r predictive-modeling random-forest python language-model sentiment-analysis encoding machine-learning deep-learning neural-network dataset caffe classification xgboost multiclass-classification unbalanced-classes time-series descriptive-statistics python r clustering machine-learning python deep-learning tensorflow machine-learning python predictive-modeling probability scikit-learn svm machine-learning python classification gradient-descent regression research python neural-network deep-learning convnet keras python tensorflow machine-learning deep-learning tensorflow python r bigdata visualization rstudio pandas pyspark dataset time-series multilabel-classification machine-learning neural-network ensemble-modeling kaggle machine-learning linear-regression cnn convnet machine-learning tensorflow association-rules machine-learning predictive-modeling training model-selection neural-network keras deep-learning deep-learning convnet image-classification predictive-modeling prediction machine-learning python classification predictive-modeling scikit-learn machine-learning python random-forest sampling training recommender-system books python neural-network nlp deep-learning tensorflow python matlab information-retrieval search search-engine deep-learning convnet keras machine-learning python cross-validation sampling machine-learning

2

Come calcolare la dimensione VC?

Sto studiando l'apprendimento automatico e vorrei sapere come calcolare la dimensione VC. Per esempio: h(x)={10if a≤x≤belse h(x)={1if a≤x≤b0else h(x)=\begin{cases} 1 &\mbox{if } a\leq x \leq b \\ 0 & \mbox{else } \end{cases} , con parametri .(a,b)∈R2(a,b)∈R2(a,b) ∈ R^2 Qual è la dimensione VC di esso?

12 machine-learning classification vc-theory

4

Come funzionerà il principio del rasoio di Occam nell'apprendimento automatico

La seguente domanda visualizzata nell'immagine è stata posta durante uno degli esami di recente. Non sono sicuro di aver compreso correttamente il principio del rasoio di Occam o no. Secondo le distribuzioni e i confini delle decisioni indicati nella domanda e seguendo l'Occam's Razor, il limite delle decisioni B in …

11 machine-learning classification

3

Esistono buoni modelli linguistici predefiniti per Python?

Sto prototipando un'applicazione e ho bisogno di un modello linguistico per calcolare la perplessità su alcune frasi generate. Esiste un modello di linguaggio addestrato in Python che posso usare facilmente? Qualcosa di semplice come model = LanguageModel('en') p1 = model.perplexity('This is a well constructed sentence') p2 = model.perplexity('Bunny lamp robert …

11 python nlp language-model r statistics linear-regression machine-learning classification random-forest xgboost python sampling data-mining orange predictive-modeling recommender-system statistics dimensionality-reduction pca machine-learning python deep-learning keras reinforcement-learning neural-network image-classification r dplyr deep-learning keras tensorflow lstm dropout machine-learning sampling categorical-data data-imputation machine-learning deep-learning machine-learning-model dropout deep-network pandas data-cleaning data-science-model aggregation python neural-network reinforcement-learning policy-gradients r dataframe dataset statistics prediction forecasting r k-means python scikit-learn labels python orange cloud-computing machine-learning neural-network deep-learning rnn recurrent-neural-net logistic-regression missing-data deep-learning autoencoder apache-hadoop time-series data preprocessing classification predictive-modeling time-series machine-learning python feature-selection autoencoder deep-learning keras tensorflow lstm word-embeddings predictive-modeling prediction machine-learning-model machine-learning classification binary theory machine-learning neural-network time-series lstm rnn neural-network deep-learning keras tensorflow convnet computer-vision

1

Utilizzando un classificatore CNN pre-addestrato e applicarlo su un set di dati di immagini diverso

Come ottimizzeresti un pre-addestrato neural network per applicarlo a un problema separato? Aggiungeresti solo più livelli al modello pre-addestrato e lo testeresti sul tuo set di dati? Ad esempio, se il compito fosse quello di utilizzare una CNN per classificare i gruppi di sfondi , sono sicuro che non avrebbe …

11 neural-network deep-learning classification convnet

2

Quando diciamo che il set di dati non è classificabile?

Ho analizzato molte volte un set di dati su cui non potevo davvero fare alcun tipo di classificazione. Per vedere se riesco a ottenere un classificatore, di solito ho usato i seguenti passi: Genera grafici a scatole di etichette rispetto a valori numerici. Riduci la dimensionalità a 2 o 3 …

11 machine-learning classification deep-learning class-imbalance bayes-error

2

Classificazione dei documenti mediante rete neurale convoluzionale

Sto cercando di usare la CNN (rete neurale convoluzionale) per classificare i documenti. La CNN per brevi testi / frasi è stata studiata in molti articoli. Tuttavia, sembra che nessun documento abbia usato la CNN per lunghi testi o documenti. Il mio problema è che ci sono troppe funzioni da …

11 classification neural-network text-mining convnet word2vec

3

Classi squilibrate - Come ridurre al minimo i falsi negativi?

Ho un set di dati che ha un attributo di classe binaria. Ci sono 623 casi con classe +1 (positivo al cancro) e 101.671 casi con classe -1 (negativo al cancro). Ho provato vari algoritmi (Naive Bayes, Random Forest, AODE, C4.5) e tutti hanno inaccettabili rapporti di falsi negativi. Random …

11 classification random-forest decision-trees unbalanced-classes

3

Costruisci un classificatore binario con solo dati positivi e senza etichetta

Ho 2 set di dati, uno con istanze positive di ciò che vorrei rilevare e uno con istanze senza etichetta. Quali metodi posso usare? Ad esempio, supponiamo di voler comprendere il rilevamento di e-mail di spam sulla base di alcune caratteristiche e-mail strutturate. Abbiamo un set di dati di 10000 …

11 classification semi-supervised-learning

4

Algoritmo per la generazione di regole di classificazione

Quindi abbiamo il potenziale per un'applicazione di machine learning che si adatta abbastanza bene al tradizionale dominio problematico risolto dai classificatori, cioè abbiamo un insieme di attributi che descrivono un elemento e un "secchio" in cui finiscono. Tuttavia, piuttosto che creare modelli di probabilità come in Naive Bayes o classificatori …

11 machine-learning classification

Domande taggate «classification»