Ho bisogno di aiuto su quello che dovrebbe essere il mio prossimo passo in un algoritmo che sto progettando. A causa delle NDA, non posso rivelare molto, ma cercherò di essere generico e comprensibile. Fondamentalmente, dopo diversi passaggi negli algoritmi, ho questo: Per ogni cliente che ho e gli eventi …
Per la sperimentazione, vorremmo usare l' emoji incorporato in molti tweet come dati di verità / allenamento di base per una semplice analisi quantitativa del senitment. I tweet di solito sono troppo destrutturati per far funzionare bene la PNL. Ad ogni modo, ci sono 722 Emoji in Unicode 6.0 e …
Classificherò documenti di testo non strutturati, vale a dire siti web di struttura sconosciuta. Il numero di classi a cui sto classificando è limitato (a questo punto, credo che non ce ne siano più di tre). Qualcuno ha un suggerimento su come potrei iniziare? L'approccio "bag of words" è possibile …
Attualmente sto usando diversi classificatori diversi su varie entità estratte dal testo, e uso la precisione / richiamo come un riepilogo di come ciascun classificatore separato si comporta in un determinato set di dati. Mi chiedo se esiste un modo significativo per confrontare le prestazioni di questi classificatori in modo …
Comprendo che i metodi di compressione possono essere suddivisi in due set principali: globale Locale Il primo set funziona indipendentemente dai dati che vengono elaborati, ovvero non si basano su alcuna caratteristica dei dati e quindi non è necessario eseguire alcuna preelaborazione su qualsiasi parte del set di dati (prima …
Esistono delle regole empiriche (o regole effettive) relative alla quantità minima, massima e "ragionevole" di celle LSTM che dovrei usare? In particolare mi riferisco a BasicLSTMCell di TensorFlow e num_unitsproprietà. Si prega di supporre che ho un problema di classificazione definito da: t - number of time steps n - …
Sto studiando l'apprendimento automatico e vorrei sapere come calcolare la dimensione VC. Per esempio: h(x)={10if a≤x≤belse h(x)={1if a≤x≤b0else h(x)=\begin{cases} 1 &\mbox{if } a\leq x \leq b \\ 0 & \mbox{else } \end{cases} , con parametri .(a,b)∈R2(a,b)∈R2(a,b) ∈ R^2 Qual è la dimensione VC di esso?
La seguente domanda visualizzata nell'immagine è stata posta durante uno degli esami di recente. Non sono sicuro di aver compreso correttamente il principio del rasoio di Occam o no. Secondo le distribuzioni e i confini delle decisioni indicati nella domanda e seguendo l'Occam's Razor, il limite delle decisioni B in …
Sto prototipando un'applicazione e ho bisogno di un modello linguistico per calcolare la perplessità su alcune frasi generate. Esiste un modello di linguaggio addestrato in Python che posso usare facilmente? Qualcosa di semplice come model = LanguageModel('en') p1 = model.perplexity('This is a well constructed sentence') p2 = model.perplexity('Bunny lamp robert …
Come ottimizzeresti un pre-addestrato neural network per applicarlo a un problema separato? Aggiungeresti solo più livelli al modello pre-addestrato e lo testeresti sul tuo set di dati? Ad esempio, se il compito fosse quello di utilizzare una CNN per classificare i gruppi di sfondi , sono sicuro che non avrebbe …
Ho analizzato molte volte un set di dati su cui non potevo davvero fare alcun tipo di classificazione. Per vedere se riesco a ottenere un classificatore, di solito ho usato i seguenti passi: Genera grafici a scatole di etichette rispetto a valori numerici. Riduci la dimensionalità a 2 o 3 …
Sto cercando di usare la CNN (rete neurale convoluzionale) per classificare i documenti. La CNN per brevi testi / frasi è stata studiata in molti articoli. Tuttavia, sembra che nessun documento abbia usato la CNN per lunghi testi o documenti. Il mio problema è che ci sono troppe funzioni da …
Ho un set di dati che ha un attributo di classe binaria. Ci sono 623 casi con classe +1 (positivo al cancro) e 101.671 casi con classe -1 (negativo al cancro). Ho provato vari algoritmi (Naive Bayes, Random Forest, AODE, C4.5) e tutti hanno inaccettabili rapporti di falsi negativi. Random …
Ho 2 set di dati, uno con istanze positive di ciò che vorrei rilevare e uno con istanze senza etichetta. Quali metodi posso usare? Ad esempio, supponiamo di voler comprendere il rilevamento di e-mail di spam sulla base di alcune caratteristiche e-mail strutturate. Abbiamo un set di dati di 10000 …
Quindi abbiamo il potenziale per un'applicazione di machine learning che si adatta abbastanza bene al tradizionale dominio problematico risolto dai classificatori, cioè abbiamo un insieme di attributi che descrivono un elemento e un "secchio" in cui finiscono. Tuttavia, piuttosto che creare modelli di probabilità come in Naive Bayes o classificatori …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.