Esiste un software che esegue un'analisi testuale sui blog? [chiuso]


8

La mia azienda sta cercando di creare una visualizzazione PivotViewer dei post sul blog di Wordpress 2 di un cliente negli ultimi 11 anni. Per fare ciò, tuttavia, dobbiamo modificare i tag alquanto casuali, incompleti e generalmente scarsi da utilizzare come categorie ordinabili. Sto cercando uno strumento che analizzerà i loro post sul blog ed eseguirà il conteggio delle parole, per darci un'idea di ciò con cui abbiamo a che fare.

Idealmente, avrebbe tutte queste caratteristiche:

  1. Lista nera di parole (ignora)
  2. Parola derivata
  3. Unione di sinonimi personalizzati
  4. Contando tutti gli usi
  5. Conteggio del numero di post in cui appare una parola.

Avrei pensato che questo tipo di analisi testuale sarebbe estremamente comune, ma non sono stato in grado di trovare alcun software che faccia questo genere di cose su interi blog. Esiste un software disponibile per farlo?


3
Interessante. In caso di dubbio, Python ha le spalle.
James T Snell,

Sì ... Spero davvero di non dover fare i miei passi su questo, però.
Brian Bauman,

c'è qualcosa che lo fa ... Ricordo che un amico ha analizzato Wikipedia ... Domani verificherò con lui
Keltari,

Risposte:


3

Il software che stai cercando può avere molti titoli, come "Analisi del contenuto" , "Nuvola di tag" o "Meta tag" e molti altri come "analisi del testo" e "mining del testo".

Ci sono molti strumenti software per questi scopi, sia gratuiti che commerciali.

Non ho esperienza personale con tali strumenti, ma un buon punto di partenza è Strumenti di analisi del testo che elenca dozzine di tali strumenti, sia gratuiti che commerciali.

Un altro di questi elenchi è Software di analisi dei testi, Estrazione di testo e Recupero di informazioni .


Ho filtrato la mia strada attraverso il primo elenco, ma nessuna delle opzioni gratuite include molto più dell'analisi linguistica. Non ho ancora dato un'occhiata al secondo elenco - Potrei finire per fare il mio.
Brian Bauman,

2

Dai un'occhiata a Rapidminer o Weka

Visto che si tratta di un blog di clienti, probabilmente hai accesso al database. Scarica tutti gli articoli in testo semplice e utilizza uno dei programmi sopra indicati per affrontare le domande sull'elaborazione del linguaggio naturale (1,2,3 e 5).

Il numero di usi è difficile da automatizzare davvero poiché ha a che fare con la determinazione automatica del significato delle parole usando il contesto.


Contando tutti gli usi, non gli utenti. Grazie per i suggerimenti, però.
Brian Bauman,

Ho letto male, Mybad. Tuttavia dovresti dare un'occhiata a Rapidminer o Weka per l'elaborazione del linguaggio naturale. Cioè, a meno che il set di dati non sia enorme, perché entrambi cercano di adattarlo alla memoria
abitante

2

uno dei software di analisi del contenuto più è WordStat progettato da Provalis Research

WordStat è un modulo di analisi del testo per QDA Miner o SimStat. WordStat combina il metodo di analisi del contenuto utilizzando l'approccio del dizionario e l'esplorazione di molti algoritmi o vari metodi di estrazione del testo. WordStat può applicare dizionari di categorizzazione esistenti a un nuovo corpus di testo. Può anche essere utilizzato nello sviluppo e nella validazione di nuovi dizionari di categorizzazione. Se utilizzato in combinazione con la codifica manuale, questo modulo può fornire assistenza per un'applicazione più sistematica delle regole di codifica, aiutare a scoprire le differenze nell'uso delle parole tra i sottogruppi di individui e aiutare nella revisione della codifica esistente utilizzando le tabelle KWIC (Keyword In Context). WordStat è specificamente progettato per studiare informazioni testuali come risposte a domande aperte, interviste, titoli, articoli di riviste, discorsi pubblici, comunicazioni elettroniche, ecc.

http://provalisresearch.com/products/content-analysis-software/



0

Ad alcune di queste domande è possibile rispondere in modo rapido e sporco utilizzando Ricerca Google sul tuo blog (più semplice se ha un proprio dominio).


0

Zemanta esegue analisi e può suggerire tag e collegamenti. È anche un plugin per wordpress.

Unico problema: allo stato attuale richiede l'apertura manuale, la selezione e il salvataggio di ciascun post.

Tuttavia, esiste un numero enorme di plug-in con tag automatico per wordpress. Dovresti cercare il plug-in finder e provarlo.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.