Domande e risposte per i professionisti della scienza dei dati, gli specialisti di Machine Learning e coloro che sono interessati a saperne di più sul campo
Voglio prevedere un valore e sto cercando di ottenere una previsione che ottimizzi tra l'essere il più basso possibile, ma che sia comunque maggiore di . In altre parole: Y ( x ) Y ( x ) costo { Y ( x ) ≳ Y ( x ) } > …
Sono un principiante nell'apprendimento automatico e sto affrontando una situazione. Sto lavorando a un problema di offerta in tempo reale, con il set di dati IPinYou e sto provando a fare una previsione di clic. Il fatto è che, come forse saprai, il set di dati è molto sbilanciato: circa …
Sono molto nuovo di Scala e Spark e sto lavorando ad alcuni esercizi fatti da sé usando le statistiche del baseball. Sto usando una classe di casi per creare un RDD e assegnare uno schema ai dati, quindi lo sto trasformando in un DataFrame in modo da poter usare SparkSQL …
Supponiamo che io abbia i classificatori C_1 ... C_n che sono disgiunti, nel senso che nessuno due restituirà true sullo stesso input (ad esempio i nodi in un albero decisionale). Voglio costruire un nuovo classificatore che è l'unione di alcuni sottogruppi di questi (ad esempio, voglio decidere su quali foglie …
Qualcuno può dirmi qual è lo scopo della generazione di funzionalità? e perché è necessario l'arricchimento dello spazio delle caratteristiche prima di classificare un'immagine? È un passo necessario? Esiste un metodo per arricchire lo spazio delle funzionalità?
Sto lavorando a un progetto di scienza dei dati relativo al mining delle relazioni sociali e ho bisogno di archiviare i dati in alcuni database di grafi. Inizialmente ho scelto Neo4j come database. Ma sembra che Neo4j non si ridimensioni bene. L'alternativa che ho scoperto sono Titan e oriebtDB. Ho …
Innanzitutto questo termine sembra così oscuro. Comunque ... sono un programmatore di software. Una delle lingue che posso codificare è Python. A proposito di dati, posso usare SQL e posso eseguire lo scraping dei dati. Quello che ho capito finora dopo aver letto così tanti articoli che Data Science è …
Una foresta casuale (RF) è creata da un insieme di Decision Trees (DT). Utilizzando il bagging, ogni DT viene addestrato in un sottoinsieme di dati diverso. Quindi, esiste un modo per implementare una foresta casuale in linea aggiungendo ulteriori decisioni su nuovi dati? Ad esempio, abbiamo 10K campioni e addestriamo …
Sto cercando di trovare un equivalente dei diagrammi di Hinton per le reti multistrato per tracciare i pesi durante l'allenamento. La rete addestrata è in qualche modo simile a un Deep SRN, cioè ha un numero elevato di matrici a peso multiplo che renderebbero visivamente confuso il diagramma simultaneo di …
Sto esplorando diversi tipi di strutture ad albero di analisi. Le due strutture ad albero di analisi ampiamente conosciute sono a) Albero di analisi basato sul collegio elettorale eb) Strutture ad albero di analisi basate sulla dipendenza. Sono in grado di utilizzare generare entrambi i tipi di strutture ad albero …
Recentemente sono stato introdotto nel campo della Data Science (sono passati circa 6 mesi), e ho iniziato il viaggio con Machine Learning Course di Andrew Ng e post che hanno iniziato a lavorare sulla Data Science Specialization di JHU. Sul fronte delle applicazioni pratiche, ho lavorato alla costruzione di un …
Quando un database relazionale, come MySQL, ha prestazioni migliori rispetto a un no relazionale, come MongoDB? Ho visto una domanda su Quora l'altro giorno, sul perché Quora utilizza ancora MySQL come backend e che le loro prestazioni sono ancora buone.
Ho una serie di risultati da un test A / B (un gruppo di controllo, un gruppo di funzioni) che non rientrano in una distribuzione normale. In effetti la distribuzione ricorda più da vicino la distribuzione di Landau. Credo che il test t indipendente richieda che i campioni siano almeno …
Sono uno studente master CS nel data mining. Il mio supervisore una volta mi disse che prima di eseguire qualsiasi classificatore o fare qualsiasi cosa con un set di dati, devo comprendere appieno i dati e assicurarmi che siano puliti e corretti. Le mie domande: Quali sono le migliori pratiche …
Ho letto molti blog \ articoli su come i diversi tipi di settori utilizzano Big Data Analytic. Ma la maggior parte di questi articoli non menziona Che tipo di dati hanno usato queste aziende. Qual era la dimensione dei dati Che tipo di strumenti utilizzavano le tecnologie per elaborare i …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.