Domande e risposte per i professionisti della scienza dei dati, gli specialisti di Machine Learning e coloro che sono interessati a saperne di più sul campo
Ho un problema di classificazione con circa 1000 campioni positivi e 10000 negativi nel set di allenamento. Quindi questo set di dati è abbastanza sbilanciato. La semplice foresta casuale sta solo cercando di contrassegnare tutti i campioni di test come una classe di maggioranza. Ecco alcune buone risposte sul sottocampionamento …
Questa domanda si riduce a "come funzionano esattamente i livelli di convoluzione . Supponiamo che io abbia un'immagine in scala di grigi . Quindi l'immagine ha un canale. Nel primo strato, applico una convoluzione 3 × 3 con k 1 filtri e riempimento. Poi ho un altro livello di convoluzione …
In particolare quello che sto cercando sono strumenti con alcune funzionalità, che è specifico per l'ingegneria delle funzionalità. Vorrei poter facilmente smussare, visualizzare, colmare lacune, ecc. Qualcosa di simile a MS Excel, ma che ha R come lingua sottostante anziché VB.
Ho un ampio set di dati (circa 8 GB). Vorrei usare l'apprendimento automatico per analizzarlo. Quindi, penso che dovrei usare SVD quindi PCA per ridurre la dimensionalità dei dati per efficienza. Tuttavia, MATLAB e Octave non possono caricare un set di dati così grande. Quali strumenti posso usare per fare …
Ho visto discussioni sul "sovraccarico" di una GPU e che per le "piccole" reti, potrebbe effettivamente essere più veloce allenarsi su una CPU (o rete di CPU) rispetto a una GPU. Cosa si intende per "piccolo"? Ad esempio, un MLP a strato singolo con 100 unità nascoste sarebbe "piccolo"? La …
Quali sono i principali vantaggi della memorizzazione dei dati in HDF? E quali sono i principali compiti di scienza dei dati in cui HDF è davvero adatto e utile?
Quindi, sto appena iniziando a imparare come una rete neurale può operare per riconoscere schemi e classificare input, e ho visto come una rete neurale artificiale può analizzare i dati delle immagini e classificare le immagini ( demo con convnetjs ), e la chiave lì consiste nel sottocampionare l'immagine e …
Quando si dovrebbe usare Random Forestoltre SVMe viceversa? Lo capisco cross-validatione il confronto tra modelli è un aspetto importante nella scelta di un modello, ma qui vorrei saperne di più sulle regole empiriche e sull'euristica dei due metodi. Qualcuno può spiegare le sottigliezze, i punti di forza e di debolezza …
Nota che sto facendo tutto in R. Il problema si presenta come segue: Fondamentalmente, ho un elenco di curriculum (CV). Alcuni candidati avranno prima esperienza lavorativa e altri no. L'obiettivo qui è: sulla base del testo dei loro CV, voglio classificarli in diversi settori lavorativi. Sono particolare in quei casi, …
Quindi, non sono stato in grado di trovare alcuna letteratura su questo argomento, ma sembra qualcosa che valga la pena di pensare: Quali sono le migliori pratiche nella formazione e ottimizzazione dei modelli se sono disponibili nuove osservazioni? Esiste un modo per determinare il periodo / la frequenza della riqualificazione …
Sto seguendo questo esempio sul sito Web di scikit-learn per eseguire una classificazione multioutput con un modello Random Forest. from sklearn.datasets import make_classification from sklearn.multioutput import MultiOutputClassifier from sklearn.ensemble import RandomForestClassifier from sklearn.utils import shuffle import numpy as np X, y1 = make_classification(n_samples=5, n_features=5, n_informative=2, n_classes=2, random_state=1) y2 = shuffle(y1, …
Ho notato che termini come iperparametro del modello e parametro del modello sono stati usati in modo intercambiabile sul web senza un chiarimento preventivo. Penso che questo sia errato e necessita di spiegazioni. Prendi in considerazione un modello di apprendimento automatico, un classificatore o riconoscitore di immagini basato su SVM …
XGBoost ha fatto un ottimo lavoro, quando si tratta di gestire variabili dipendenti sia categoriche che continue. Ma come posso selezionare i parametri ottimizzati per un problema XGBoost? Ecco come ho applicato i parametri per un recente problema di Kaggle: param <- list( objective = "reg:linear", booster = "gbtree", eta …
La somiglianza di Jaccard e la somiglianza del coseno sono due misurazioni molto comuni mentre si confrontano le somiglianze degli oggetti. Tuttavia, non sono molto chiaro in quale situazione quale dovrebbe essere preferibile rispetto a un altro. Qualcuno può aiutare a chiarire le differenze di queste due misurazioni (la differenza …
Ho un po 'di conoscenza autodidatta lavorando con algoritmi di Machine Learning (roba di base di tipo Random Forest e Linear Regression). Ho deciso di diramare e iniziare a imparare RNN con Keras. Quando osservo la maggior parte degli esempi, che di solito implicano previsioni di stock, non sono stato …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.