Domande e risposte per i professionisti della scienza dei dati, gli specialisti di Machine Learning e coloro che sono interessati a saperne di più sul campo
Ho riscontrato un problema di classificazione e ho letto il codice e le esercitazioni di molte persone. Una cosa che ho notato è che molte persone prendono np.logo logdi variabili continue come loan_amounto applicant_incomeecc. Voglio solo capire il motivo dietro. Aiuta a migliorare la precisione della previsione del nostro modello. …
Creo un corr()df da un df originale. Il corr()df è venuto fuori 70 X 70 ed è impossibile visualizzare il heatmap ... sns.heatmap(df). Se provo a visualizzare il corr = df.corr(), la tabella non si adatta allo schermo e posso vedere tutte le correlazioni. È un modo per stampare l'intero …
Nel blog di Keras sulle reti di addestramento da zero , il codice mostra solo la rete in esecuzione sui dati di addestramento e convalida. E i dati dei test? I dati di validazione sono gli stessi dei dati di test (penso di no). Se esiste una cartella di test …
La seguente funzione di previsione fornisce anche -ve valori, quindi non può essere una probabilità. param <- list(max.depth = 5, eta = 0.01, objective="binary:logistic",subsample=0.9) bst <- xgboost(param, data = x_mat, label = y_mat,nround = 3000) pred_s <- predict(bst, x_mat_s2) Ho cercato su google pred_s <- predict(bst, x_mat_s2,type="response") ma non ha …
L'estrazione e la selezione delle caratteristiche riducono sostanzialmente la dimensionalità dei dati, ma l'estrazione delle caratteristiche rende anche i dati più separabili, se ho ragione. Quale tecnica sarebbe preferita rispetto alle altre e quando? Stavo pensando, poiché la selezione delle funzionalità non modifica i dati originali e le sue proprietà, …
https://github.com/Rdatatable/data.table/wiki/Benchmarks-%3A-Grouping I benchmark data.table non sono stati aggiornati dal 2014. Ho sentito da qualche parte che Pandasora è più veloce di data.table. È vero? Qualcuno ha fatto dei benchmark? Non ho mai usato Python prima, ma prenderei in considerazione il passaggio se pandasposso battere data.table?
L'implementazione casuale della foresta in scikit-learn utilizza l'accuratezza media come metodo di calcolo del punteggio per stimare l'errore di generalizzazione con campioni out-of-bag? Questo non è menzionato nella documentazione, ma il metodo score () riporta l'accuratezza media. Ho un set di dati altamente sbilanciato e sto usando AUC di ROC …
Supponiamo di avere due tipi di funzionalità di input, categoriche e continue. I dati categorici possono essere rappresentati come un codice di scelta rapida A, mentre i dati continui sono solo un vettore B nello spazio N-dimensione. Sembra che usare semplicemente concat (A, B) non sia una buona scelta perché …
Ho imparato che, per creare un modello di regressione, dobbiamo occuparci delle variabili categoriali convertendole in variabili fittizie. Ad esempio, se, nel nostro set di dati, esiste una variabile come posizione: Location ---------- Californian NY Florida Dobbiamo convertirli come: 1 0 0 0 1 0 0 0 1 Tuttavia, è …
Sono uno studente universitario matricola (menzionandolo in modo da poter perdonare la mia non familiarità) che attualmente sta facendo ricerche usando le reti neurali. Ho codificato una rete neurale a tre nodi (che funziona) in base alla guida del mio professore. Tuttavia, mi piacerebbe perseguire una carriera in AI e …
Diciamo che ho una foto dall'alto in basso di una freccia e voglio prevedere l'angolazione di questa freccia. Questo sarebbe tra e 360 gradi, o tra 0 e 2 π . Il problema è che questo obiettivo è circolare, 0 e 360 gradi sono esattamente gli stessi che è un'invarianza …
Supponiamo di aver completato l'apprendimento del trasferimento su una rete pre-formata per riconoscere 10 oggetti. Come aggiungere un undicesimo oggetto che la rete può classificare senza perdere tutte le 10 categorie che ho già addestrato né le informazioni del modello pre-addestrato originale? Un amico mi ha detto che la ricerca …
Ho studiato i tipi di funzione di attivazione per le reti neurali. Le funzioni stesse sono piuttosto semplici, ma la differenza tra le applicazioni non è del tutto chiara. È ragionevole distinguere tra funzioni di tipo logico e lineare, a seconda dell'output binario / continuo desiderato, ma qual è il …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.