Scienza dei dati python

1

Qual è il miglior modello di Keras per la classificazione multi-classe?

Sto lavorando sulla ricerca, in cui necessità di una classificare dei WINNER tre eventi = ( win, draw, lose) WINNER LEAGUE HOME AWAY MATCH_HOME MATCH_DRAW MATCH_AWAY MATCH_U2_50 MATCH_O2_50 3 13 550 571 1.86 3.34 4.23 1.66 2.11 3 7 322 334 7.55 4.1 1.4 2.17 1.61 Il mio modello attuale …

30 python neural-network classification clustering keras

1

Perché xgboost è molto più veloce di sklearn GradientBoostingClassifier?

Sto cercando di formare un modello di aumento gradiente su 50.000 esempi con 100 funzioni numeriche. XGBClassifiergestisce 500 alberi entro 43 secondi sulla mia macchina, mentre GradientBoostingClassifiergestisce solo 10 alberi (!) in 1 minuto e 2 secondi :( Non mi sono preoccupato di provare a far crescere 500 alberi perché …

29 scikit-learn xgboost gbm data-mining classification data-cleaning machine-learning reinforcement-learning data-mining bigdata dataset nlp language-model stanford-nlp machine-learning neural-network deep-learning randomized-algorithms machine-learning beginner career xgboost loss-function neural-network software-recommendation naive-bayes-classifier classification scikit-learn feature-selection r random-forest cross-validation data-mining python scikit-learn random-forest churn python clustering k-means machine-learning nlp sentiment-analysis machine-learning programming python scikit-learn nltk gensim visualization data csv neural-network deep-learning descriptive-statistics machine-learning supervised-learning text-mining orange data parameter-estimation python pandas scraping r clustering k-means unsupervised-learning

3

Parametri XGBoost per l'ipertensione

XGBoost ha fatto un ottimo lavoro, quando si tratta di gestire variabili dipendenti sia categoriche che continue. Ma come posso selezionare i parametri ottimizzati per un problema XGBoost? Ecco come ho applicato i parametri per un recente problema di Kaggle: param <- list( objective = "reg:linear", booster = "gbtree", eta …

27 r python xgboost

3

Come forzare i pesi ad essere non negativi nella regressione lineare

Sto usando una regressione lineare standard usando scikit-learn in Python. Tuttavia, vorrei forzare i pesi a essere tutti positivi per ogni caratteristica (non negativa), c'è un modo per riuscirci? Stavo cercando nella documentazione ma non riuscivo a trovare un modo per farlo. Capisco che potrei non ottenere la soluzione migliore, …

27 python scikit-learn linear-regression

1

PyTorch vs. Tensorflow Fold

Sia PyTorch che Tensorflow Fold sono framework di apprendimento profondo intesi a gestire situazioni in cui i dati di input hanno lunghezza o dimensioni non uniformi (ovvero situazioni in cui i grafici dinamici sono utili o necessari). Mi piacerebbe sapere come si confrontano, nel senso di paradigmi su cui si …

26 python deep-learning tensorflow pytorch

7

Come clonare l'ambiente di lavoro Python su un'altra macchina?

Ho sviluppato un modello di apprendimento automatico con Python (Anaconda + Flask) sulla mia workstation e tutto va bene. Successivamente, ho provato a spedire questo programma su un'altra macchina dove ovviamente ho provato a impostare lo stesso ambiente, ma il programma non si avvia. Ho copiato il programma su altre …

26 python anaconda

2

Fusione di due diversi modelli in Keras

Sto cercando di unire due modelli Keras in un unico modello e non sono in grado di farlo. Ad esempio, nella figura allegata, vorrei recuperare il livello centrale della dimensione 8 e utilizzarlo come input per il livello (di nuovo dimensione 8) nel modello e quindi combinare sia il modello …

26 machine-learning python deep-learning keras tensorflow

6

Tecniche di apprendimento automatico per stimare l'età degli utenti in base ai siti di Facebook che preferiscono

Ho un database dalla mia applicazione Facebook e sto cercando di utilizzare l'apprendimento automatico per stimare l'età degli utenti in base ai siti Facebook che preferiscono. Ci sono tre caratteristiche cruciali del mio database: la distribuzione dell'età nel mio set di formazione (in totale 12k di utenti) è distorta rispetto …

25 machine-learning dimensionality-reduction python

4

C'è un modo semplice per eseguire panda.DataFrame.isin in parallelo?

Ho un programma di modellazione e punteggio che fa un uso DataFrame.isinintensivo della funzione dei panda, cercando negli elenchi di Facebook "come" i record dei singoli utenti per ciascuna delle poche migliaia di pagine specifiche. Questa è la parte del programma che richiede più tempo, più che la modellazione o …

25 performance python pandas parallel

4

Word2Vec per il riconoscimento dell'entità denominata

Sto cercando di utilizzare l'implementazione di word2vec di Google per creare un sistema di riconoscimento delle entità denominato. Ho sentito che le reti neurali ricorsive con propagazione posteriore attraverso la struttura sono adatte per compiti di riconoscimento di entità nominate, ma non sono stato in grado di trovare un'implementazione decente …

25 machine-learning python neural-network nlp

5

Immagine VM per progetti di data science

Poiché ci sono numerosi strumenti disponibili per le attività di data science, è complicato installare tutto e creare un sistema perfetto. Esiste un'immagine Linux / Mac OS con Python, R e altri strumenti di data science open source installati e disponibili per l'uso immediato? Un Ubuntu o un sistema operativo …

24 python r tools

4

Scikit-learn: far prevedere SGDClassifier e una regressione logistica

Un modo per addestrare una regressione logistica consiste nell'utilizzare la discesa graduale stocastica, a cui scikit-learn offre un'interfaccia. Quello che vorrei fare è prendere un SGDClassifier di scikit-learn e farlo segnare come una regressione logistica qui . Tuttavia, devo mancare alcuni miglioramenti dell'apprendimento automatico, poiché i miei punteggi non sono …

24 python logistic-regression scikit-learn gradient-descent

3

Best practice per l'archiviazione di modelli di machine learning Python

Quali sono le migliori pratiche per salvare, archiviare e condividere modelli di apprendimento automatico? In Python, generalmente archiviamo la rappresentazione binaria del modello, usando pickle o joblib. I modelli, nel mio caso, possono essere ~ 100Mo più grandi. Inoltre, joblib può salvare un modello su più file se non impostato …

24 python databases binary

4

È necessario standardizzare i dati prima del clustering?

È necessario standardizzare i dati prima del cluster? Nell'esempio tratto da scikit learnDBSCAN, qui lo fanno nella riga: X = StandardScaler().fit_transform(X) Ma non capisco perché sia necessario. Dopotutto, il clustering non presuppone una particolare distribuzione dei dati: è un metodo di apprendimento non supervisionato, quindi il suo obiettivo è quello …

23 python clustering clusters anomaly-detection

5

Calcolo della divergenza di KL in Python

Sono piuttosto nuovo in questo e non posso dire di avere una completa comprensione dei concetti teorici alla base di questo. Sto cercando di calcolare la divergenza KL tra diversi elenchi di punti in Python. Sto usando http://scikit-learn.org/stable/modules/generated/sklearn.metrics.mutual_info_score.html per provare a farlo. Il problema che sto incontrando è che il …

22 python clustering scikit-learn

Domande taggate «python»