Domande taggate «data-mining»

Un'attività che cerca modelli in set di dati complessi e di grandi dimensioni. Di solito enfatizza le tecniche algoritmiche, ma può anche coinvolgere qualsiasi insieme di competenze, applicazioni o metodologie correlate con tale obiettivo.

13
K-Clustering per dati numerici e categorici misti
Il mio set di dati contiene un numero di attributi numerici e uno categoriale. Di ' NumericAttr1, NumericAttr2, ..., NumericAttrN, CategoricalAttr, dove CategoricalAttrassume uno dei tre valori possibili: CategoricalAttrValue1, CategoricalAttrValue2o CategoricalAttrValue3. Sto usando l'implementazione predefinita dell'algoritmo di clustering k-means per Octave https://blog.west.uni-koblenz.de/2012-07-14/a-working-k-means-code-for-octave/ . Funziona solo con dati numerici. Quindi la …




1

6
Come fare SVD e PCA con i big data?
Ho un ampio set di dati (circa 8 GB). Vorrei usare l'apprendimento automatico per analizzarlo. Quindi, penso che dovrei usare SVD quindi PCA per ridurre la dimensionalità dei dati per efficienza. Tuttavia, MATLAB e Octave non possono caricare un set di dati così grande. Quali strumenti posso usare per fare …

3
Coefficiente di Gini vs impurità di Gini - alberi decisionali
Il problema si riferisce alla costruzione di alberi decisionali. Secondo Wikipedia il " coefficiente di Gini " non deve essere confuso con "l' impurità di Gini ". Tuttavia, entrambe le misure possono essere utilizzate quando si costruisce un albero decisionale: possono supportare le nostre scelte quando si divide il set …



4
Significato delle caratteristiche latenti?
Sto imparando la fattorizzazione a matrice per i sistemi di raccomandazione e sto vedendo il termine latent featuresricorrere troppo frequentemente ma non riesco a capire cosa significhi. So cos'è una funzionalità ma non capisco l'idea di funzionalità latenti. Potresti spiegarlo, per favore? O almeno indicami un documento / un luogo …

4
La scienza dei dati è la stessa del data mining?
Sono sicuro che la scienza dei dati, come sarà discusso in questo forum, ha diversi sinonimi o almeno campi correlati in cui vengono analizzati dati di grandi dimensioni. La mia domanda particolare riguarda il Data Mining. Ho preso un corso di laurea in Data Mining qualche anno fa. Quali sono …



4
Quale modello statistico dovrei usare per analizzare la probabilità che un singolo evento abbia influenzato i dati longitudinali
Sto cercando di trovare una formula, un metodo o un modello da utilizzare per analizzare la probabilità che un evento specifico abbia influenzato alcuni dati longitudinali. Sto avendo difficoltà a capire cosa cercare su Google. Ecco uno scenario di esempio: Immagina di possedere un'azienda che ha una media di 100 …


Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.