Domande taggate «data-mining»

Il data mining utilizza metodi dell'intelligenza artificiale in un contesto di database per scoprire modelli precedentemente sconosciuti. Di conseguenza, i metodi sono generalmente senza supervisione. È strettamente correlato ma non identico all'apprendimento automatico. Le attività chiave del data mining sono l'analisi dei cluster, il rilevamento anomalo e il mining delle regole di associazione.


8
Esegui il clustering di K-medie (o dei suoi parenti stretti) con solo una matrice di distanza, non dati punto per caratteristica
Voglio eseguire il clustering dei mezzi K sugli oggetti che ho, ma gli oggetti non sono descritti come punti nello spazio, cioè per objects x featuresset di dati. Tuttavia, sono in grado di calcolare la distanza tra due oggetti qualsiasi (si basa su una funzione di somiglianza). Quindi, dispongo della …

5
Nuovo modo rivoluzionario di data mining?
Il seguente estratto è tratto dall'Hedge Fund Market Wizzards di Schwager (maggio 2012), un'intervista al gestore di hedge fund di successo costantemente Jaffray Woodriff: Alla domanda: "Quali sono alcuni dei peggiori errori che le persone commettono nel data mining?": Molte persone pensano di stare bene perché usano i dati all'interno …

3
Primo passo per i big data (
Supponiamo che tu stia analizzando un enorme insieme di dati al ritmo di miliardi di osservazioni al giorno, in cui ogni osservazione ha un paio di migliaia di variabili numeriche e categoriche sparse e possibilmente ridondanti. Diciamo che c'è un problema di regressione, un problema di classificazione binaria sbilanciato e …

4
Gli alberi decisionali sono quasi sempre alberi binari?
Quasi ogni esempio di albero decisionale che ho incontrato sembra essere un albero binario. È praticamente universale? La maggior parte degli algoritmi standard (C4.5, CART, ecc.) Supporta solo alberi binari? Da quello che raccolgo, CHAID non si limita agli alberi binari, ma sembra essere un'eccezione. Una divisione a due vie …





2
Funzione "Interessante" per domande StackExchange
Sto cercando di mettere insieme un pacchetto di data mining per i siti StackExchange e, in particolare, sono bloccato nel tentativo di determinare le domande "più interessanti". Vorrei utilizzare il punteggio della domanda, ma rimuovere la distorsione a causa del numero di visualizzazioni, ma non so come affrontarlo rigorosamente. Nel …

1
Supervisione a distanza: supervisionato, semi-supervisionato o entrambi?
La "supervisione a distanza" è uno schema di apprendimento in cui viene appreso un classificatore in base a un set di formazione debolmente etichettato (i dati di training vengono etichettati automaticamente in base a euristiche / regole). Penso che sia l'apprendimento supervisionato sia l'apprendimento semi-supervisionato possano includere tale "supervisione a …


3
Qual è la differenza pratica tra regole di associazione e alberi decisionali nel data mining?
Esiste una descrizione davvero semplice delle differenze pratiche tra queste due tecniche? Entrambi sembrano essere utilizzati per l'apprendimento supervisionato (anche se le regole di associazione possono anche gestire senza supervisione). Entrambi possono essere utilizzati per la previsione La più vicina che ho trovato ad una descrizione "buona" è dal libro …



Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.