Scienza dei dati

Domande e risposte per i professionisti della scienza dei dati, gli specialisti di Machine Learning e coloro che sono interessati a saperne di più sul campo

10
Cosa sono gli strati deconvoluzionali?
Di recente ho letto Reti pienamente convoluzionali per la segmentazione semantica di Jonathan Long, Evan Shelhamer, Trevor Darrell. Non capisco cosa fanno gli "strati deconvoluzionali" / come funzionano. La parte rilevante è 3.3. Upsampling è una convoluzione guidata all'indietro Un altro modo per collegare output grossolani a pixel densi è ...

30
Set di dati disponibili pubblicamente
Uno dei problemi comuni nella scienza dei dati è la raccolta di dati da varie fonti in un formato in qualche modo pulito (semi-strutturato) e la combinazione di metriche da varie fonti per effettuare un'analisi di livello superiore. Osservando lo sforzo degli altri, in particolare altre domande su questo sito, ...

13
K-Clustering per dati numerici e categorici misti
Il mio set di dati contiene un numero di attributi numerici e uno categoriale. Di ' NumericAttr1, NumericAttr2, ..., NumericAttrN, CategoricalAttr, dove CategoricalAttrassume uno dei tre valori possibili: CategoricalAttrValue1, CategoricalAttrValue2o CategoricalAttrValue3. Sto usando l'implementazione predefinita dell'algoritmo di clustering k-means per Octave https://blog.west.uni-koblenz.de/2012-07-14/a-working-k-means-code-for-octave/ . Funziona solo con dati numerici. Quindi la ...




5
La funzione di errore di entropia incrociata nelle reti neurali
Nel MNIST per principianti ML definiscono l'entropia incrociata come Hy′(y):=−∑iy′ilog(yi)Hy′(y):=−∑iyi′log⁡(yi)H_{y'} (y) := - \sum_{i} y_{i}' \log (y_i) yiyiy_i è il valore di probabilità previsto per la classe e è la vera probabilità per quella classe.iiiy′iyi′y_i' Domanda 1 Non è un problema che (in ) possa essere 0? Ciò significherebbe che ...

8
Differenza tra fit e fit_transform nei modelli scikit_learn?
Sono un principiante della scienza dei dati e non capisco la differenza tra fite i fit_transformmetodi di scikit-learn. Qualcuno può semplicemente spiegare perché potremmo aver bisogno di trasformare i dati? Che cosa significa adattamento del modello ai dati di allenamento e trasformazione in dati di test? Significa, ad esempio, convertire ...


15
Python vs R per l'apprendimento automatico
Ho appena iniziato a sviluppare un'applicazione di apprendimento automatico per scopi accademici. Attualmente sto usando R e mi sto allenando. Tuttavia, in molti posti, ho visto persone che usano Python . Cosa usano le persone nel mondo accademico e nell'industria e qual è la raccomandazione?


6
Quando utilizzare GRU su LSTM?
La differenza chiave tra un GRU e un LSTM è che un GRU ha due gate ( reset e update gate) mentre un LSTM ha tre gate (vale a dire input , output e dimenticare gate). Perché utilizziamo il GRU quando abbiamo chiaramente un maggiore controllo sulla rete attraverso il ...

12
Quanto sono grandi i big data?
Molte persone usano il termine big data in un modo piuttosto commerciale , come mezzo per indicare che nel calcolo sono coinvolti grandi set di dati, e quindi le potenziali soluzioni devono avere buone prestazioni. Naturalmente, i big data portano sempre termini associati, come scalabilità ed efficienza, ma cosa definisce ...



Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.