Utilizzare per domande sulla scienza dei dati relative al linguaggio di programmazione Python. Non destinato a domande di codifica generali (-> stackoverflow).
Sto lavorando sulla ricerca, in cui necessità di una classificare dei WINNER tre eventi = ( win, draw, lose) WINNER LEAGUE HOME AWAY MATCH_HOME MATCH_DRAW MATCH_AWAY MATCH_U2_50 MATCH_O2_50 3 13 550 571 1.86 3.34 4.23 1.66 2.11 3 7 322 334 7.55 4.1 1.4 2.17 1.61 Il mio modello attuale …
Sto cercando di formare un modello di aumento gradiente su 50.000 esempi con 100 funzioni numeriche. XGBClassifiergestisce 500 alberi entro 43 secondi sulla mia macchina, mentre GradientBoostingClassifiergestisce solo 10 alberi (!) in 1 minuto e 2 secondi :( Non mi sono preoccupato di provare a far crescere 500 alberi perché …
XGBoost ha fatto un ottimo lavoro, quando si tratta di gestire variabili dipendenti sia categoriche che continue. Ma come posso selezionare i parametri ottimizzati per un problema XGBoost? Ecco come ho applicato i parametri per un recente problema di Kaggle: param <- list( objective = "reg:linear", booster = "gbtree", eta …
Sto usando una regressione lineare standard usando scikit-learn in Python. Tuttavia, vorrei forzare i pesi a essere tutti positivi per ogni caratteristica (non negativa), c'è un modo per riuscirci? Stavo cercando nella documentazione ma non riuscivo a trovare un modo per farlo. Capisco che potrei non ottenere la soluzione migliore, …
Sia PyTorch che Tensorflow Fold sono framework di apprendimento profondo intesi a gestire situazioni in cui i dati di input hanno lunghezza o dimensioni non uniformi (ovvero situazioni in cui i grafici dinamici sono utili o necessari). Mi piacerebbe sapere come si confrontano, nel senso di paradigmi su cui si …
Ho sviluppato un modello di apprendimento automatico con Python (Anaconda + Flask) sulla mia workstation e tutto va bene. Successivamente, ho provato a spedire questo programma su un'altra macchina dove ovviamente ho provato a impostare lo stesso ambiente, ma il programma non si avvia. Ho copiato il programma su altre …
Sto cercando di unire due modelli Keras in un unico modello e non sono in grado di farlo. Ad esempio, nella figura allegata, vorrei recuperare il livello centrale della dimensione 8 e utilizzarlo come input per il livello (di nuovo dimensione 8) nel modello e quindi combinare sia il modello …
Ho un database dalla mia applicazione Facebook e sto cercando di utilizzare l'apprendimento automatico per stimare l'età degli utenti in base ai siti Facebook che preferiscono. Ci sono tre caratteristiche cruciali del mio database: la distribuzione dell'età nel mio set di formazione (in totale 12k di utenti) è distorta rispetto …
Ho un programma di modellazione e punteggio che fa un uso DataFrame.isinintensivo della funzione dei panda, cercando negli elenchi di Facebook "come" i record dei singoli utenti per ciascuna delle poche migliaia di pagine specifiche. Questa è la parte del programma che richiede più tempo, più che la modellazione o …
Sto cercando di utilizzare l'implementazione di word2vec di Google per creare un sistema di riconoscimento delle entità denominato. Ho sentito che le reti neurali ricorsive con propagazione posteriore attraverso la struttura sono adatte per compiti di riconoscimento di entità nominate, ma non sono stato in grado di trovare un'implementazione decente …
Poiché ci sono numerosi strumenti disponibili per le attività di data science, è complicato installare tutto e creare un sistema perfetto. Esiste un'immagine Linux / Mac OS con Python, R e altri strumenti di data science open source installati e disponibili per l'uso immediato? Un Ubuntu o un sistema operativo …
Un modo per addestrare una regressione logistica consiste nell'utilizzare la discesa graduale stocastica, a cui scikit-learn offre un'interfaccia. Quello che vorrei fare è prendere un SGDClassifier di scikit-learn e farlo segnare come una regressione logistica qui . Tuttavia, devo mancare alcuni miglioramenti dell'apprendimento automatico, poiché i miei punteggi non sono …
Quali sono le migliori pratiche per salvare, archiviare e condividere modelli di apprendimento automatico? In Python, generalmente archiviamo la rappresentazione binaria del modello, usando pickle o joblib. I modelli, nel mio caso, possono essere ~ 100Mo più grandi. Inoltre, joblib può salvare un modello su più file se non impostato …
È necessario standardizzare i dati prima del cluster? Nell'esempio tratto da scikit learnDBSCAN, qui lo fanno nella riga: X = StandardScaler().fit_transform(X) Ma non capisco perché sia necessario. Dopotutto, il clustering non presuppone una particolare distribuzione dei dati: è un metodo di apprendimento non supervisionato, quindi il suo obiettivo è quello …
Sono piuttosto nuovo in questo e non posso dire di avere una completa comprensione dei concetti teorici alla base di questo. Sto cercando di calcolare la divergenza KL tra diversi elenchi di punti in Python. Sto usando http://scikit-learn.org/stable/modules/generated/sklearn.metrics.mutual_info_score.html per provare a farlo. Il problema che sto incontrando è che il …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.