Domande taggate «text-mining»

Si riferisce a un sottoinsieme di data mining relativo all'estrazione di informazioni dai dati sotto forma di testo riconoscendo i modelli. L'obiettivo del text mining è spesso quello di classificare un determinato documento in una di una serie di categorie in modo automatico e di migliorare queste prestazioni in modo dinamico, rendendolo un esempio di apprendimento automatico. Un esempio di questo tipo di text mining sono i filtri antispam utilizzati per la posta elettronica.


5
Classificazione del testo su larga scala
Sto cercando di fare una classificazione sui miei dati di testo. Ho 300 classes, 200 documenti di formazione per classe (quindi 60000 documents in total) e questo probabilmente porterà a dati dimensionali molto alti (potremmo guardare oltre 1 milione di dimensioni ). Vorrei eseguire i seguenti passaggi nella pipeline (solo …

2
Perché il classificatore di regressione della cresta funziona abbastanza bene per la classificazione del testo?
Durante un esperimento per la classificazione del testo, ho scoperto che il classificatore di cresta genera risultati che completano costantemente i test tra quei classificatori che sono più comunemente citati e applicati per attività di estrazione del testo, come SVM, NB, kNN, ecc. Tuttavia, non ho elaborato sull'ottimizzazione di ogni …






4
Text Mining: come raggruppare i testi (ad es. Articoli di notizie) con l'intelligenza artificiale?
Ho creato alcune reti neurali (MLP (completamente connesse), Elman (ricorrenti)) per diversi compiti, come giocare a Pong, classificare cifre scritte a mano e cose ... Inoltre ho cercato di costruire alcune prime reti neurali convoluzionali, ad esempio per classificare note scritte a mano a più cifre, ma sono completamente nuovo …




2
Esempi di mining di testo con R (pacchetto tm)
Ho trascorso tre giorni a dilettarmi tmdopo aver letto una bozza di un amico in cui ha esplorato un corpus di testo con UCINET, mostrando nuvole di testo, grafici di rete a due modalità e decomposizione a valore singolo (con grafica, usando Stata). Ho riscontrato un gran numero di problemi: …
14 r  text-mining 

2
In che modo gli n-grammi diventano controproducenti?
Quando si esegue l'elaborazione del linguaggio naturale, si può prendere un corpus e valutare la probabilità che la parola successiva si verifichi in una sequenza di n. n viene solitamente scelto come 2 o 3 (bigrammi e trigrammi). Esiste un punto noto in cui il rilevamento dei dati per l'ennesima …

1
Estrazione automatica delle parole chiave: utilizzo delle somiglianze del coseno come funzionalità
Ho una matrice di documenti e ora vorrei estrarre parole chiave per ogni documento con un metodo di apprendimento supervisionato (SVM, Naive Bayes, ...). In questo modello, utilizzo già Tf-idf, tag Pos, ...MMM Ma ora mi chiedo dei prossimi. Ho una matrice con le somiglianze del coseno tra i termini.CCC …

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.