Scienza dei dati

Domande e risposte per i professionisti della scienza dei dati, gli specialisti di Machine Learning e coloro che sono interessati a saperne di più sul campo

Data Science in C (o C ++)

Sono un Rprogrammatore di lingue. Sono anche nel gruppo di persone che sono considerate Data Scientist ma che provengono da discipline accademiche diverse dalla CS. Questo funziona bene nel mio ruolo di Data Scientist, tuttavia, iniziando la mia carriera Re avendo solo una conoscenza di base di altri linguaggi di …

40 machine-learning bigdata statistics programming c

Gli algoritmi di machine learning possono prevedere i punteggi o le giocate sportive?

Ho una serie di set di dati NFL che penso possano costituire un buon progetto collaterale, ma non ho ancora fatto nulla con loro. Venire su questo sito mi ha fatto pensare agli algoritmi di machine learning e mi chiedevo quanto potessero essere bravi a predire il risultato dei giochi …

40 machine-learning sports

Quando usare cosa - Apprendimento automatico [chiuso]

Recentemente in una lezione di Machine Learning del professor Oriol Pujol presso UPC / Barcellona ha descritto gli algoritmi, i principi e i concetti più comuni da utilizzare per una vasta gamma di attività correlate all'apprendimento automatico. Qui li condivido con te e ti chiedo: Esistono attività di abbinamento del …

39 machine-learning algorithms

Batch_size in Keras ha effetti sulla qualità dei risultati?

Sto per formare una grande rete LSTM con 2-3 milioni di articoli e sto lottando con errori di memoria (utilizzo AWS EC2 g2x2large). Ho scoperto che una soluzione è ridurre il batch_size. Tuttavia, non sono sicuro se questo parametro sia correlato solo a problemi di efficienza della memoria o se …

38 deep-learning keras

Devo imparare Hadoop come scienziato dei dati?

Un aspirante scienziato di dati qui. Non so nulla di Hadoop, ma mentre leggo di Data Science e Big Data, vedo molto parlare di Hadoop. È assolutamente necessario imparare Hadoop come scienziato dei dati?

38 bigdata apache-hadoop

Qual è la differenza tra "equivariante alla traduzione" e "invariante alla traduzione"

Ho difficoltà a comprendere la differenza tra equivariante alla traduzione e invariante alla traduzione . Nel libro Deep Learning . MIT Press, 2016 (I. Goodfellow, A. Courville e Y. Bengio), si possono trovare sulle reti convoluzionali: [...] la particolare forma di condivisione dei parametri fa sì che il layer abbia …

38 neural-network deep-learning convolution

I data scientist usano Excel?

Mi considererei uno scienziato dei dati del giornalista. Come la maggior parte (penso), ho realizzato le mie prime classifiche e fatto le mie prime aggregazioni al liceo e al college, usando Excel. Mentre attraversavo l'università, la scuola di specializzazione e ~ 7 anni di esperienza lavorativa, ho rapidamente raccolto quelli …

37 tools career excel

Come interpretare l'output di importanza XGBoost?

Ho eseguito un modello xgboost. Non so esattamente come interpretare l'output di xgb.importance. Qual è il significato di guadagno, copertura e frequenza e come li interpretiamo? Inoltre, cosa significano Split, RealCover e RealCover%? Ho alcuni parametri extra qui Ci sono altri parametri che possono dirmi di più sull'importanza delle funzionalità? …

37 machine-learning xgboost

Scikit-learn ha un algoritmo di selezione diretta / regressione graduale?

Sto lavorando al problema con troppe funzioni e la formazione dei miei modelli richiede troppo tempo. Ho implementato l'algoritmo di selezione diretta per scegliere le funzionalità. Tuttavia, mi chiedevo scikit-learn ha algoritmo di selezione in avanti / regressione graduale?

37 feature-selection scikit-learn

Calcolo e visualizzazione della matrice di correlazione con i panda

Ho un frame di dati Panda con diverse voci e voglio calcolare la correlazione tra le entrate di un tipo di negozi. Esistono numerosi negozi con dati sul reddito, classificazione dell'area di attività (teatro, negozi di vestiti, cibo ...) e altri dati. Ho provato a creare un nuovo frame di …

35 python statistics visualization pandas

Citazioni divertenti relative alla scienza dei dati

È stato consuetudine per gli utenti di comunità diverse citare cose divertenti sui loro campi. Potrebbe essere divertente condividere le tue cose divertenti su Machine Learning, Deep Learning, Data Science e le cose che affronti ogni giorno!

35 machine-learning neural-network deep-learning

Cosa ne pensi delle certificazioni di Data Science?

Ora ho visto due programmi di certificazione della scienza dei dati: quello di John Hopkins disponibile a Coursera e quello di Cloudera . Sono sicuro che ce ne sono altri là fuori. L'insieme di classi di John Hopkins si concentra su R come set di strumenti, ma copre una vasta …

35 education

Nell'apprendimento supervisionato, perché è male avere caratteristiche correlate?

Ho letto da qualche parte che se abbiamo funzionalità troppo correlate, dobbiamo rimuoverne una, poiché ciò potrebbe peggiorare il modello. È chiaro che funzionalità correlate significano che portano le stesse informazioni, quindi è logico rimuoverne una. Ma non riesco a capire perché questo possa peggiorare il modello.

35 machine-learning correlation

Spiegazione della perdita di entropia incrociata

Supponiamo che io costruisca un NN per la classificazione. L'ultimo livello è un livello denso con attivazione softmax. Ho cinque diverse classi da classificare. Supponiamo per un singolo esempio di allenamento, true labelè [1 0 0 0 0]mentre le previsioni sono [0.1 0.5 0.1 0.1 0.2]. Come calcolare la perdita …

35 machine-learning deep-learning

La differenza tra `Dense` e` TimeDistributedDense` di `Keras`

Sono ancora confuso sulla differenza tra Densee TimeDistributedDensedi Kerasanche se ci sono già alcune domande simili poste qui e qui . Le persone discutono molto, ma nessuna conclusione condivisa. E anche se, qui , @fchollet ha dichiarato che: TimeDistributedDenseapplica una stessa operazione Dense(completamente connessa) a ogni timestep di un tensore …

34 machine-learning neural-network keras

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.

Licensed under cc by-sa 3.0 with attribution required.