Domande e risposte per i professionisti della scienza dei dati, gli specialisti di Machine Learning e coloro che sono interessati a saperne di più sul campo
Sto lavorando a un concorso di scienza dei dati per il quale la distribuzione del mio set di test è diversa dal set di training. Voglio sottocampionare le osservazioni dal set di addestramento che assomiglia molto al set di test. Come posso fare questo?
Sto cercando di eseguire xgboost in scikit learn. E io uso solo Panda per caricare i dati in dataframe. Come dovrei usare Panda Panda con xgboost. Sono confuso dalla routine DMatrix richiesta per eseguire xgboost algo.
Come si usa LeakyRelu come funzione di attivazione nella sequenza DNN in keras? Se voglio scrivere qualcosa di simile a: model = Sequential() model.add(Dense(90, activation='LeakyRelu')) Qual'è la soluzione? Metti LeakyRelu simile a Relu? La seconda domanda è: quali sono le migliori impostazioni generali per l'ottimizzazione dei parametri di LeakyRelu? Quando …
Non sono uno specialista in materia e la mia domanda è probabilmente molto ingenua. Deriva da un saggio per comprendere i poteri e le limitazioni dell'apprendimento per rinforzo come usato nel programma AlphaGo. Il programma AlphaGo è stato realizzato utilizzando, tra le altre cose (esplorazione degli alberi di Monte-Carlo, ecc.) …
Da quanto ho capito, gli algoritmi genetici sono potenti strumenti per l'ottimizzazione multi-obiettivo. Inoltre, addestrare le reti neurali (specialmente quelle profonde) è difficile e presenta molti problemi (funzioni di costo non convesse - minimi locali, gradienti di fuga e di esplosione, ecc.). Inoltre, sono fattibile allenare concettualmente una NN con …
Sto cercando di capire questo documento e non sono sicuro di cosa sia il upsampling bi-lineare. Qualcuno può spiegare questo ad alto livello? https://arxiv.org/abs/1606.00915
La pagina di Wikipedia che cita "Gli elementi dell'apprendimento statistico" dice: In genere, per un problema di classificazione con funzionalità ppp , le funzioni vengono utilizzate in ogni divisione.⌊ p-√⌋⌊p⌋\lfloor \sqrt{p}\rfloor Capisco che si tratta di una supposizione abbastanza istruita e probabilmente è stata confermata da prove empiriche, ma ci …
Se alleno il mio modello utilizzando il seguente codice: import xgboost as xg params = {'max_depth':3, 'min_child_weight':10, 'learning_rate':0.3, 'subsample':0.5, 'colsample_bytree':0.6, 'obj':'reg:linear', 'n_estimators':1000, 'eta':0.3} features = df[feature_columns] target = df[target_columns] dmatrix = xg.DMatrix(features.values, target.values, feature_names=features.columns.values) clf = xg.train(params, dmatrix) termina in circa 1 minuto. Se alleno il mio modello usando il …
Ho un dataframe che, tra l'altro, contiene una colonna del numero di millisecondi passati dal 1970-1-1. Devo convertire questa colonna di ints in dati di data / ora, quindi posso in definitiva convertirla in una colonna di dati di data / ora aggiungendo la serie di colonne di data / …
Mode Analytics ha una bella funzione heatmap ( https://community.modeanalytics.com/gallery/geographic-heat-map/ ). Ma non è favorevole al confronto delle mappe (solo una per rapporto). Ciò che consentono è che i dati vengano estratti facilmente in un notebook Python incartato. E quindi qualsiasi immagine in Python può essere facilmente aggiunta a un rapporto. …
Ho una piccola domanda secondaria a questa domanda . Capisco che quando si propaga indietro attraverso uno strato di pool massimo il gradiente viene instradato indietro in modo tale che il neurone nel livello precedente che è stato selezionato come max ottenga tutto il gradiente. Ciò di cui non sono …
Sto usando Scikit-learn Random Forest Classifier e voglio tracciare l'importanza delle funzionalità come in questo esempio . Tuttavia, il mio risultato è completamente diverso, nel senso che l'importanza della deviazione standard è quasi sempre maggiore dell'importanza della caratteristica stessa (vedi immagine allegata). È possibile avere questo tipo di comportamento, o …
Ho documenti di testo che contengono principalmente elenchi di articoli. Ogni elemento è un gruppo di più token di diversi tipi: Nome, Cognome, Data di nascita, Numero di telefono, Città, Occupazione, ecc. Un token è un gruppo di parole. Gli articoli possono trovarsi su più righe. Gli elementi di un …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.