Domande e risposte per i professionisti della scienza dei dati, gli specialisti di Machine Learning e coloro che sono interessati a saperne di più sul campo
Sono un Rprogrammatore di lingue. Sono anche nel gruppo di persone che sono considerate Data Scientist ma che provengono da discipline accademiche diverse dalla CS. Questo funziona bene nel mio ruolo di Data Scientist, tuttavia, iniziando la mia carriera Re avendo solo una conoscenza di base di altri linguaggi di …
Ho una serie di set di dati NFL che penso possano costituire un buon progetto collaterale, ma non ho ancora fatto nulla con loro. Venire su questo sito mi ha fatto pensare agli algoritmi di machine learning e mi chiedevo quanto potessero essere bravi a predire il risultato dei giochi …
Recentemente in una lezione di Machine Learning del professor Oriol Pujol presso UPC / Barcellona ha descritto gli algoritmi, i principi e i concetti più comuni da utilizzare per una vasta gamma di attività correlate all'apprendimento automatico. Qui li condivido con te e ti chiedo: Esistono attività di abbinamento del …
Sto per formare una grande rete LSTM con 2-3 milioni di articoli e sto lottando con errori di memoria (utilizzo AWS EC2 g2x2large). Ho scoperto che una soluzione è ridurre il batch_size. Tuttavia, non sono sicuro se questo parametro sia correlato solo a problemi di efficienza della memoria o se …
Un aspirante scienziato di dati qui. Non so nulla di Hadoop, ma mentre leggo di Data Science e Big Data, vedo molto parlare di Hadoop. È assolutamente necessario imparare Hadoop come scienziato dei dati?
Ho difficoltà a comprendere la differenza tra equivariante alla traduzione e invariante alla traduzione . Nel libro Deep Learning . MIT Press, 2016 (I. Goodfellow, A. Courville e Y. Bengio), si possono trovare sulle reti convoluzionali: [...] la particolare forma di condivisione dei parametri fa sì che il layer abbia …
Mi considererei uno scienziato dei dati del giornalista. Come la maggior parte (penso), ho realizzato le mie prime classifiche e fatto le mie prime aggregazioni al liceo e al college, usando Excel. Mentre attraversavo l'università, la scuola di specializzazione e ~ 7 anni di esperienza lavorativa, ho rapidamente raccolto quelli …
Ho eseguito un modello xgboost. Non so esattamente come interpretare l'output di xgb.importance. Qual è il significato di guadagno, copertura e frequenza e come li interpretiamo? Inoltre, cosa significano Split, RealCover e RealCover%? Ho alcuni parametri extra qui Ci sono altri parametri che possono dirmi di più sull'importanza delle funzionalità? …
Sto lavorando al problema con troppe funzioni e la formazione dei miei modelli richiede troppo tempo. Ho implementato l'algoritmo di selezione diretta per scegliere le funzionalità. Tuttavia, mi chiedevo scikit-learn ha algoritmo di selezione in avanti / regressione graduale?
Ho un frame di dati Panda con diverse voci e voglio calcolare la correlazione tra le entrate di un tipo di negozi. Esistono numerosi negozi con dati sul reddito, classificazione dell'area di attività (teatro, negozi di vestiti, cibo ...) e altri dati. Ho provato a creare un nuovo frame di …
È stato consuetudine per gli utenti di comunità diverse citare cose divertenti sui loro campi. Potrebbe essere divertente condividere le tue cose divertenti su Machine Learning, Deep Learning, Data Science e le cose che affronti ogni giorno!
Ora ho visto due programmi di certificazione della scienza dei dati: quello di John Hopkins disponibile a Coursera e quello di Cloudera . Sono sicuro che ce ne sono altri là fuori. L'insieme di classi di John Hopkins si concentra su R come set di strumenti, ma copre una vasta …
Ho letto da qualche parte che se abbiamo funzionalità troppo correlate, dobbiamo rimuoverne una, poiché ciò potrebbe peggiorare il modello. È chiaro che funzionalità correlate significano che portano le stesse informazioni, quindi è logico rimuoverne una. Ma non riesco a capire perché questo possa peggiorare il modello.
Supponiamo che io costruisca un NN per la classificazione. L'ultimo livello è un livello denso con attivazione softmax. Ho cinque diverse classi da classificare. Supponiamo per un singolo esempio di allenamento, true labelè [1 0 0 0 0]mentre le previsioni sono [0.1 0.5 0.1 0.1 0.2]. Come calcolare la perdita …
Sono ancora confuso sulla differenza tra Densee TimeDistributedDensedi Kerasanche se ci sono già alcune domande simili poste qui e qui . Le persone discutono molto, ma nessuna conclusione condivisa. E anche se, qui , @fchollet ha dichiarato che: TimeDistributedDenseapplica una stessa operazione Dense(completamente connessa) a ogni timestep di un tensore …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.