Scienza dei dati

10

Di recente ho letto Reti pienamente convoluzionali per la segmentazione semantica di Jonathan Long, Evan Shelhamer, Trevor Darrell. Non capisco cosa fanno gli "strati deconvoluzionali" / come funzionano. La parte rilevante è 3.3. Upsampling è una convoluzione guidata all'indietro Un altro modo per collegare output grossolani a pixel densi è …

188 neural-network convnet convolution

30

Set di dati disponibili pubblicamente

Uno dei problemi comuni nella scienza dei dati è la raccolta di dati da varie fonti in un formato in qualche modo pulito (semi-strutturato) e la combinazione di metriche da varie fonti per effettuare un'analisi di livello superiore. Osservando lo sforzo degli altri, in particolare altre domande su questo sito, …

168 open-source dataset

13

K-Clustering per dati numerici e categorici misti

Il mio set di dati contiene un numero di attributi numerici e uno categoriale. Di ' NumericAttr1, NumericAttr2, ..., NumericAttrN, CategoricalAttr, dove CategoricalAttrassume uno dei tre valori possibili: CategoricalAttrValue1, CategoricalAttrValue2o CategoricalAttrValue3. Sto usando l'implementazione predefinita dell'algoritmo di clustering k-means per Octave https://blog.west.uni-koblenz.de/2012-07-14/a-working-k-means-code-for-octave/ . Funziona solo con dati numerici. Quindi la …

133 data-mining clustering octave k-means categorical-data

17

La migliore libreria Python per reti neurali

Sto usando Neural Networks per risolvere diversi problemi di machine learning. Sto usando Python e pybrain ma questa libreria è quasi fuori produzione. Ci sono altre buone alternative in Python?

130 machine-learning python neural-network

8

Come impostare i pesi delle classi per le classi sbilanciate in Keras?

So che esiste una possibilità in Keras con il class_weightsdizionario dei parametri adatto, ma non sono riuscito a trovare alcun esempio. Qualcuno sarebbe così gentile da offrirne uno? A proposito, in questo caso la prassi appropriata è semplicemente quella di ponderare la classe di minoranza proporzionalmente alla sua sottorappresentazione?

130 classification keras weighted-data

5

Qual è il problema del "morire ReLU" nelle reti neurali?

Facendo riferimento alle note del corso di Stanford su Convolutional Neural Networks for Visual Recognition , un paragrafo dice: "Sfortunatamente, le unità ReLU possono essere fragili durante l'allenamento e possono" morire ". Ad esempio, una grande pendenza che fluisce attraverso un neurone ReLU potrebbe far aggiornare i pesi in modo …

119 machine-learning neural-network deep-learning

5

La funzione di errore di entropia incrociata nelle reti neurali

Nel MNIST per principianti ML definiscono l'entropia incrociata come Hy′(y):=−∑iy′ilog(yi)Hy′(y):=−∑iyi′log⁡(yi)H_{y'} (y) := - \sum_{i} y_{i}' \log (y_i) yiyiy_i è il valore di probabilità previsto per la classe e è la vera probabilità per quella classe.iiiy′iyi′y_i' Domanda 1 Non è un problema che (in ) possa essere 0? Ciò significherebbe che …

115 machine-learning tensorflow

8

Differenza tra fit e fit_transform nei modelli scikit_learn?

Sono un principiante della scienza dei dati e non capisco la differenza tra fite i fit_transformmetodi di scikit-learn. Qualcuno può semplicemente spiegare perché potremmo aver bisogno di trasformare i dati? Che cosa significa adattamento del modello ai dati di allenamento e trasformazione in dati di test? Significa, ad esempio, convertire …

110 python scikit-learn

6

Micro Media vs Macro media Prestazioni in un'impostazione di classificazione Multiclass

Sto provando un'impostazione di classificazione multiclasse con 3 classi. La distribuzione delle classi è distorta e la maggior parte dei dati rientra in 1 delle 3 classi. (le etichette di classe sono 1,2,3, con il 67,28% dei dati che rientrano nell'etichetta di classe 1, i dati dell'11,99% in classe 2 …

103 multiclass-classification evaluation

15

Python vs R per l'apprendimento automatico

Ho appena iniziato a sviluppare un'applicazione di apprendimento automatico per scopi accademici. Attualmente sto usando R e mi sto allenando. Tuttavia, in molti posti, ho visto persone che usano Python . Cosa usano le persone nel mondo accademico e nell'industria e qual è la raccomandazione?

101 machine-learning r python

3

Quando utilizzare One Hot Encoding vs LabelEncoder vs DictVectorizor?

Ho creato modelli con dati categorici per un po 'di tempo e quando in questa situazione fondamentalmente non utilizzo la funzione LabelEncoder di scikit-learn per trasformare questi dati prima di creare un modello. Capisco la differenza tra OHE, LabelEncodere DictVectorizorin termini di ciò che stanno facendo per i dati, ma …

97 scikit-learn categorical-data feature-engineering

6

Quando utilizzare GRU su LSTM?

La differenza chiave tra un GRU e un LSTM è che un GRU ha due gate ( reset e update gate) mentre un LSTM ha tre gate (vale a dire input , output e dimenticare gate). Perché utilizziamo il GRU quando abbiamo chiaramente un maggiore controllo sulla rete attraverso il …

95 neural-network deep-learning

12

Quanto sono grandi i big data?

Molte persone usano il termine big data in un modo piuttosto commerciale , come mezzo per indicare che nel calcolo sono coinvolti grandi set di dati, e quindi le potenziali soluzioni devono avere buone prestazioni. Naturalmente, i big data portano sempre termini associati, come scalabilità ed efficienza, ma cosa definisce …

86 bigdata scalability efficiency performance

8

Scelta di un tasso di apprendimento

Attualmente sto lavorando all'implementazione della Discesa stocastica del gradiente SGD, per le reti neurali che usano la propagazione di ritorno, e mentre capisco il suo scopo ho alcune domande su come scegliere i valori per il tasso di apprendimento. Il tasso di apprendimento è correlato alla forma del gradiente di …

85 machine-learning neural-network deep-learning optimization hyperparameter

15

Come si visualizzano le architetture di reti neurali?

Quando si scrive un documento / si fa una presentazione su un argomento che riguarda le reti neurali, di solito si visualizza l'architettura delle reti. Quali sono i modi buoni / semplici per visualizzare automaticamente le architetture comuni?

80 machine-learning neural-network deep-learning visualization