Risposte:
Vale la pena guardare i libri di MW Berry:
Sono costituiti da una serie di documenti applicati e di revisione. L'ultima sembra essere disponibile in PDF al seguente indirizzo: http://bit.ly/deNeiy .
Ecco alcuni link relativi alla CA applicati al mining di testo:
Puoi anche esaminare l' analisi semantica latente , ma vedere la mia risposta lì: risolvere un problema di clustering .
Ricerca di gruppi nei dati. Un'introduzione all'analisi dei cluster dei professori Leonard Kaufman e Peter J. Rousseeuw.
Sto leggendo il libro e lo trovo molto utile perché:
Il nostro scopo era quello di scrivere un libro applicato per l'utente generico. Volevamo rendere l'analisi dei cluster disponibile per le persone che non hanno necessariamente un forte background matematico o statistico.
Fornisce contenuti teorici per comprendere le funzioni disponibili nel Rpacchetto Cluster .
I capitoli possono essere letti individualmente secondo il metodo di interesse del cluster.
l'eccezione è il capitolo 3, che si basa sul capitolo 2
I capitoli del libro sono:
Riferimenti:
Kaufman, L., & Rousseeuw, PJ (2005). Ricerca di gruppi nei dati. Un'introduzione all'analisi dei cluster (p. 342). John Wiley & Sons Inc.
Maechler, M. (2013). Cluster Analysis Extended Rousseeuw et al. CRAN.
Questo capitolo di Introduzione al Data Mining è disponibile online e offre una buona panoramica.
Non in particolare sul text mining, ma mi è piaciuta molto "Exploratory Data Analysis with MATLAB" di Martinez e Martinez.
Un altro libro di approfondimento degno di nota: Manuale di analisi dei cluster di Hennig et al. (2015)