Domande taggate «text-mining»

Si riferisce a un sottoinsieme di data mining relativo all'estrazione di informazioni dai dati sotto forma di testo riconoscendo i modelli. L'obiettivo del text mining è spesso quello di classificare un determinato documento in una di una serie di categorie in modo automatico e di migliorare queste prestazioni in modo dinamico, rendendolo un esempio di apprendimento automatico. Un esempio di questo tipo di text mining sono i filtri antispam utilizzati per la posta elettronica.


1



3
Estrazione di parole chiave / frasi dal testo usando le librerie di Deep Learning
Forse questo è troppo ampio, ma sto cercando riferimenti su come utilizzare l'apprendimento profondo in un compito di sintesi testuale. Ho già implementato il riepilogo del testo utilizzando approcci di frequenza di parole standard e classificazione delle frasi, ma mi piacerebbe esplorare la possibilità di utilizzare tecniche di apprendimento profondo …

3
qual è la differenza tra classificazione del testo e modelli di argomenti?
Conosco la differenza tra clustering e classificazione nell'apprendimento automatico, ma non capisco la differenza tra la classificazione del testo e la modellazione degli argomenti per i documenti. Posso utilizzare la modellazione degli argomenti sui documenti per identificare un argomento? Posso utilizzare i metodi di classificazione per classificare il testo all'interno …



4
Come annotare documenti di testo con metadati?
Avendo molti documenti di testo (in linguaggio naturale, non strutturato), quali sono i modi possibili per annotarli con alcuni metadati semantici? Ad esempio, considera un breve documento: I saw the company's manager last day. Per poter estrarre informazioni da esso, devono essere annotate con dati aggiuntivi per essere meno ambigue. …


1
Algoritmi per il clustering di testo
Ho un problema nel raggruppare una grande quantità di frasi in gruppi in base al loro significato. Questo è simile a un problema quando hai molte frasi e vuoi raggrupparle in base al loro significato. Quali algoritmi sono suggeriti per fare questo? Non conosco il numero di cluster in anticipo …

2
Estrai la maggior parte delle parti informative del testo dai documenti
Ci sono articoli o discussioni sull'estrazione di parte del testo che contiene la maggior parte delle informazioni sul documento corrente. Ad esempio, ho un ampio corpus di documenti dello stesso dominio. Ci sono parti di testo che contengono le informazioni chiave di cui parla un singolo documento. Voglio estrarre alcune …
16 nlp  text-mining 

5
ingrandisci la mappa di calore dei nati marini
Creo un corr()df da un df originale. Il corr()df è venuto fuori 70 X 70 ed è impossibile visualizzare il heatmap ... sns.heatmap(df). Se provo a visualizzare il corr = df.corr(), la tabella non si adatta allo schermo e posso vedere tutte le correlazioni. È un modo per stampare l'intero …
16 visualization  pandas  plotting  machine-learning  neural-network  svm  decision-trees  svm  efficiency  python  linear-regression  machine-learning  nlp  topic-model  lda  named-entity-recognition  naive-bayes-classifier  association-rules  fuzzy-logic  kaggle  deep-learning  tensorflow  inception  classification  feature-selection  feature-engineering  machine-learning  scikit-learn  tensorflow  keras  encoding  nlp  text-mining  nlp  rnn  python  neural-network  feature-extraction  machine-learning  predictive-modeling  python  r  linear-regression  clustering  r  ggplot2  neural-network  neural-network  training  python  neural-network  deep-learning  rnn  predictive-modeling  databases  sql  programming  distribution  dataset  cross-validation  neural-network  deep-learning  rnn  machine-learning  machine-learning  python  deep-learning  data-mining  tensorflow  visualization  tools  sql  embeddings  orange  feature-extraction  unsupervised-learning  gan  machine-learning  python  data-mining  pandas  machine-learning  data-mining  bigdata  apache-spark  apache-hadoop  deep-learning  python  convnet  keras  aggregation  clustering  k-means  r  random-forest  decision-trees  reference-request  visualization  data  pandas  plotting  neural-network  keras  rnn  theano  deep-learning  tensorflow  inception  predictive-modeling  deep-learning  regression  sentiment-analysis  nlp  encoding  deep-learning  python  scikit-learn  lda  convnet  keras  predictive-modeling  regression  overfitting  regression  svm  prediction  machine-learning  similarity  word2vec  information-retrieval  word-embeddings  neural-network  deep-learning  rnn 



Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.