Scienza dei dati

Domande e risposte per i professionisti della scienza dei dati, gli specialisti di Machine Learning e coloro che sono interessati a saperne di più sul campo

11
Data Science in C (o C ++)
Sono un Rprogrammatore di lingue. Sono anche nel gruppo di persone che sono considerate Data Scientist ma che provengono da discipline accademiche diverse dalla CS. Questo funziona bene nel mio ruolo di Data Scientist, tuttavia, iniziando la mia carriera Re avendo solo una conoscenza di base di altri linguaggi di …


3
Quando usare cosa - Apprendimento automatico [chiuso]
Recentemente in una lezione di Machine Learning del professor Oriol Pujol presso UPC / Barcellona ha descritto gli algoritmi, i principi e i concetti più comuni da utilizzare per una vasta gamma di attività correlate all'apprendimento automatico. Qui li condivido con te e ti chiedo: Esistono attività di abbinamento del …

3
Batch_size in Keras ha effetti sulla qualità dei risultati?
Sto per formare una grande rete LSTM con 2-3 milioni di articoli e sto lottando con errori di memoria (utilizzo AWS EC2 g2x2large). Ho scoperto che una soluzione è ridurre il batch_size. Tuttavia, non sono sicuro se questo parametro sia correlato solo a problemi di efficienza della memoria o se …



11
I data scientist usano Excel?
Mi considererei uno scienziato dei dati del giornalista. Come la maggior parte (penso), ho realizzato le mie prime classifiche e fatto le mie prime aggregazioni al liceo e al college, usando Excel. Mentre attraversavo l'università, la scuola di specializzazione e ~ 7 anni di esperienza lavorativa, ho rapidamente raccolto quelli …
37 tools  career  excel 

2
Come interpretare l'output di importanza XGBoost?
Ho eseguito un modello xgboost. Non so esattamente come interpretare l'output di xgb.importance. Qual è il significato di guadagno, copertura e frequenza e come li interpretiamo? Inoltre, cosa significano Split, RealCover e RealCover%? Ho alcuni parametri extra qui Ci sono altri parametri che possono dirmi di più sull'importanza delle funzionalità? …




13
Cosa ne pensi delle certificazioni di Data Science?
Ora ho visto due programmi di certificazione della scienza dei dati: quello di John Hopkins disponibile a Coursera e quello di Cloudera . Sono sicuro che ce ne sono altri là fuori. L'insieme di classi di John Hopkins si concentra su R come set di strumenti, ma copre una vasta …
35 education 


6
Spiegazione della perdita di entropia incrociata
Supponiamo che io costruisca un NN per la classificazione. L'ultimo livello è un livello denso con attivazione softmax. Ho cinque diverse classi da classificare. Supponiamo per un singolo esempio di allenamento, true labelè [1 0 0 0 0]mentre le previsioni sono [0.1 0.5 0.1 0.1 0.2]. Come calcolare la perdita …


Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.