k-means è una famiglia di metodi di analisi dei cluster in cui specifichi il numero di cluster che ti aspetti. Ciò è in contrasto con i metodi di analisi dei cluster gerarchici.
Il mio set di dati contiene un numero di attributi numerici e uno categoriale. Di ' NumericAttr1, NumericAttr2, ..., NumericAttrN, CategoricalAttr, dove CategoricalAttrassume uno dei tre valori possibili: CategoricalAttrValue1, CategoricalAttrValue2o CategoricalAttrValue3. Sto usando l'implementazione predefinita dell'algoritmo di clustering k-means per Octave https://blog.west.uni-koblenz.de/2012-07-14/a-working-k-means-code-for-octave/ . Funziona solo con dati numerici. Quindi la …
Qual è il giusto approccio e algoritmo di clustering per il clustering di geolocalizzazione? Sto usando il seguente codice per raggruppare le coordinate di geolocalizzazione: import numpy as np import matplotlib.pyplot as plt from scipy.cluster.vq import kmeans2, whiten coordinates= np.array([ [lat, long], [lat, long], ... [lat, long] ]) x, y …
Sto cercando di formare un modello di aumento gradiente su 50.000 esempi con 100 funzioni numeriche. XGBClassifiergestisce 500 alberi entro 43 secondi sulla mia macchina, mentre GradientBoostingClassifiergestisce solo 10 alberi (!) in 1 minuto e 2 secondi :( Non mi sono preoccupato di provare a far crescere 500 alberi perché …
Sto cercando di raggruppare alcuni vettori con 90 funzioni con K-medie. Poiché questo algoritmo mi chiede il numero di cluster, voglio confermare la mia scelta con un po 'di matematica piacevole. Mi aspetto di avere da 8 a 10 cluster. Le funzionalità sono ridimensionate con punteggio Z. Spiegazione del metodo …
Quando viene utilizzata un'inizializzazione casuale di centroidi, diverse esecuzioni di K significano diversi SSE totali. Ed è cruciale nelle prestazioni dell'algoritmo. Quali sono alcuni approcci efficaci per risolvere questo problema? Sono apprezzati gli approcci recenti.
Creo un corr()df da un df originale. Il corr()df è venuto fuori 70 X 70 ed è impossibile visualizzare il heatmap ... sns.heatmap(df). Se provo a visualizzare il corr = df.corr(), la tabella non si adatta allo schermo e posso vedere tutte le correlazioni. È un modo per stampare l'intero …
K-means è un algoritmo ben noto per il clustering, ma esiste anche una variante online di tale algoritmo (K-medie online). Quali sono i pro e i contro di questi approcci e quando dovrebbero essere preferiti?
Sto cercando di fare un cluster di k-medie su un insieme di punti 10-dimensionali. Il trucco: ci sono 10 ^ 10 punti . Sto cercando solo il centro e le dimensioni dei cluster più grandi (diciamo da 10 a 100 cluster); Non mi interessa in quale cluster finisce ogni punto. …
Sto prototipando un'applicazione e ho bisogno di un modello linguistico per calcolare la perplessità su alcune frasi generate. Esiste un modello di linguaggio addestrato in Python che posso usare facilmente? Qualcosa di semplice come model = LanguageModel('en') p1 = model.perplexity('This is a well constructed sentence') p2 = model.perplexity('Bunny lamp robert …
Ho cercato di comprendere i diversi algoritmi di clustering di k-means principalmente implementati nel statspacchetto del Rlinguaggio. Capisco l'algoritmo di Lloyd e l'algoritmo online di MacQueen. Il modo in cui li capisco è il seguente: Algoritmo di Lloyd: Inizialmente vengono scelte le osservazioni casuali "k" che serviranno da centroidi dei …
I miei dati includono risposte al sondaggio che sono binarie (numeriche) e nominali / categoriche. Tutte le risposte sono discrete e a livello individuale. I dati sono di forma (n = 7219, p = 105). Cose di coppia: Sto cercando di identificare una tecnica di clustering con una misura di …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.