Domande taggate «clustering»

L'analisi o il clustering del cluster è il compito di raggruppare un insieme di oggetti in modo tale che gli oggetti nello stesso gruppo (chiamato cluster) siano più simili (in un certo senso o nell'altro) tra loro rispetto a quelli di altri gruppi (cluster) . È un compito principale del data mining esplorativo e una tecnica comune per l'analisi dei dati statistici, utilizzata in molti campi, tra cui l'apprendimento automatico, il riconoscimento dei modelli, l'analisi delle immagini, il recupero delle informazioni ecc.



4
Suggerisci set di dati di addestramento per la classificazione dei testi
Quali set di dati disponibili gratuitamente posso usare per addestrare un classificatore di testo? Stiamo cercando di migliorare il coinvolgimento dei nostri utenti raccomandandogli il contenuto più correlato, quindi abbiamo pensato che se avessimo classificato i nostri contenuti in base a un sacco di parole predefinito, potremmo consigliargli di coinvolgere …





3
Come valutare il clustering di testo?
Quali metriche possono essere utilizzate per valutare i modelli di clustering di testo? Ho usato tf-idf+ k-means, tf-idf+ hierarchical clustering, doc2vec+ k-means (metric is cosine similarity), doc2vec+ hierarchical clustering (metric is cosine similarity). Come decidere quale modello è il migliore?


1
Qual è la differenza tra autovettori a matrice di affinità e autovettori laplaciani grafici nel contesto del clustering spettrale?
Nel clustering spettrale, è pratica standard risolvere il problema degli autovettori Lv=λvLv=λvL v = \lambda v dove è il grafico Laplaciano, è l'autovettore relativo a autovalore .LLLvvvλλ\lambda La mia domanda: perché preoccuparsi di prendere il grafico Laplacian? Non potrei semplicemente risolvere il problema di autovettore per il grafico (matrice di …


Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.