Domande e risposte per i professionisti della scienza dei dati, gli specialisti di Machine Learning e coloro che sono interessati a saperne di più sul campo
Durante la lettura della generazione di testo con le reti neurali ricorrenti ho notato che alcuni esempi sono stati implementati per generare testo parola per parola e altri carattere per carattere senza dichiarare effettivamente il perché. Quindi, qual è la differenza tra i modelli RNN che prevedono la base del …
Ho seguito il corso sulle reti neurali di Geoff Hinton su Coursera e anche attraverso l' introduzione alle macchine boltzmann riservate , ma non capivo l'intuizione dietro gli RBM. Perché dobbiamo calcolare l'energia in questa macchina? E a che serve la probabilità in questa macchina? Ho visto anche questo video …
Esistono pacchetti di apprendimento automatico per R che possono utilizzare la GPU per migliorare la velocità di allenamento (qualcosa come theano dal mondo Python)? Vedo che esiste un pacchetto chiamato gputools che consente l'esecuzione di codice sulla gpu, ma sto cercando una libreria più completa per l'apprendimento automatico.
Quale libreria Python stabile posso usare per implementare i modelli nascosti di Markov? Ho bisogno che sia ragionevolmente ben documentato, perché non ho mai usato questo modello prima d'ora. In alternativa, esiste un approccio più diretto per eseguire un'analisi delle serie temporali su un set di dati utilizzando HMM?
So che Spark è completamente integrato con Scala. Il suo caso d'uso è specifico per grandi set di dati. Quali altri strumenti hanno un buon supporto Scala? Scala è più adatta per set di dati più grandi? O è adatto anche per set di dati più piccoli?
Supponiamo un insieme di dati vagamente strutturati (ad es. Tabelle Web / dati aperti collegati), composto da molte origini dati. Non esiste uno schema comune seguito dai dati e ogni fonte può usare attributi sinonimo per descrivere i valori (ad es. "Nazionalità" vs "bornIn"). Il mio obiettivo è trovare alcuni …
Ho sentito parlare di molti strumenti / framework per aiutare le persone a elaborare i propri dati (ambiente big data). Uno si chiama Hadoop e l'altro è il concetto noSQL. Qual è la differenza nel punto di elaborazione? Sono complementari?
Esaurirò il mio LSTM se lo alleno attraverso l'approccio a finestra scorrevole? Perché le persone non sembrano usarlo per gli LSTM? Per un esempio semplificato, supponiamo che dobbiamo prevedere la sequenza di caratteri: A B C D E F G H I J K L M N O P Q …
Stavo attraversando una soluzione della concorrenza sui prezzi delle case su Kaggle ( Human Analog's Kernel on House Prices: Advance Regression Techniques ) e mi sono imbattuto in questa parte: # Transform the skewed numeric features by taking log(feature + 1). # This will make the features more normal. from …
Sto cercando una libreria Python che mi aiuti a identificare la somiglianza tra due parole o frasi. Farò la conversione da audio a testo che si tradurrà in un dizionario inglese o parole non di dizionario (potrebbe essere il nome di una persona o di un'azienda). Successivamente, devo confrontarlo con …
Attualmente mi sto preparando per un esame sulle reti neurali. In diversi protocolli degli esami precedenti ho letto che le funzioni di attivazione dei neuroni (nei percetroni multistrato) devono essere monotoniche. Comprendo che le funzioni di attivazione dovrebbero essere differenziabili, avere una derivata che non è 0 sulla maggior parte …
Il contributo a progetti open source è in genere un buon modo per ottenere un po 'di pratica per i neofiti e provare una nuova area per esperti data scientist e analisti. A quali progetti contribuisci? Fornisci alcuni link introduttivi + su Github.
Vorrei sapere in che modo esattamente i consigli basati sull'utente e quelli basati sugli articoli differiscono l'uno dall'altro. Lo definisce Basato sull'utente : consiglia gli articoli trovando utenti simili. Questo è spesso più difficile da ridimensionare a causa della natura dinamica degli utenti. Basato su articoli : calcola la somiglianza …
K-means è un algoritmo ben noto per il clustering, ma esiste anche una variante online di tale algoritmo (K-medie online). Quali sono i pro e i contro di questi approcci e quando dovrebbero essere preferiti?
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.