Domande e risposte per i professionisti della scienza dei dati, gli specialisti di Machine Learning e coloro che sono interessati a saperne di più sul campo
Di recente ho letto Reti pienamente convoluzionali per la segmentazione semantica di Jonathan Long, Evan Shelhamer, Trevor Darrell. Non capisco cosa fanno gli "strati deconvoluzionali" / come funzionano. La parte rilevante è 3.3. Upsampling è una convoluzione guidata all'indietro Un altro modo per collegare output grossolani a pixel densi è …
Uno dei problemi comuni nella scienza dei dati è la raccolta di dati da varie fonti in un formato in qualche modo pulito (semi-strutturato) e la combinazione di metriche da varie fonti per effettuare un'analisi di livello superiore. Osservando lo sforzo degli altri, in particolare altre domande su questo sito, …
Il mio set di dati contiene un numero di attributi numerici e uno categoriale. Di ' NumericAttr1, NumericAttr2, ..., NumericAttrN, CategoricalAttr, dove CategoricalAttrassume uno dei tre valori possibili: CategoricalAttrValue1, CategoricalAttrValue2o CategoricalAttrValue3. Sto usando l'implementazione predefinita dell'algoritmo di clustering k-means per Octave https://blog.west.uni-koblenz.de/2012-07-14/a-working-k-means-code-for-octave/ . Funziona solo con dati numerici. Quindi la …
Sto usando Neural Networks per risolvere diversi problemi di machine learning. Sto usando Python e pybrain ma questa libreria è quasi fuori produzione. Ci sono altre buone alternative in Python?
So che esiste una possibilità in Keras con il class_weightsdizionario dei parametri adatto, ma non sono riuscito a trovare alcun esempio. Qualcuno sarebbe così gentile da offrirne uno? A proposito, in questo caso la prassi appropriata è semplicemente quella di ponderare la classe di minoranza proporzionalmente alla sua sottorappresentazione?
Facendo riferimento alle note del corso di Stanford su Convolutional Neural Networks for Visual Recognition , un paragrafo dice: "Sfortunatamente, le unità ReLU possono essere fragili durante l'allenamento e possono" morire ". Ad esempio, una grande pendenza che fluisce attraverso un neurone ReLU potrebbe far aggiornare i pesi in modo …
Nel MNIST per principianti ML definiscono l'entropia incrociata come Hy′(y):=−∑iy′ilog(yi)Hy′(y):=−∑iyi′log(yi)H_{y'} (y) := - \sum_{i} y_{i}' \log (y_i) yiyiy_i è il valore di probabilità previsto per la classe e è la vera probabilità per quella classe.iiiy′iyi′y_i' Domanda 1 Non è un problema che (in ) possa essere 0? Ciò significherebbe che …
Sono un principiante della scienza dei dati e non capisco la differenza tra fite i fit_transformmetodi di scikit-learn. Qualcuno può semplicemente spiegare perché potremmo aver bisogno di trasformare i dati? Che cosa significa adattamento del modello ai dati di allenamento e trasformazione in dati di test? Significa, ad esempio, convertire …
Sto provando un'impostazione di classificazione multiclasse con 3 classi. La distribuzione delle classi è distorta e la maggior parte dei dati rientra in 1 delle 3 classi. (le etichette di classe sono 1,2,3, con il 67,28% dei dati che rientrano nell'etichetta di classe 1, i dati dell'11,99% in classe 2 …
Ho appena iniziato a sviluppare un'applicazione di apprendimento automatico per scopi accademici. Attualmente sto usando R e mi sto allenando. Tuttavia, in molti posti, ho visto persone che usano Python . Cosa usano le persone nel mondo accademico e nell'industria e qual è la raccomandazione?
Ho creato modelli con dati categorici per un po 'di tempo e quando in questa situazione fondamentalmente non utilizzo la funzione LabelEncoder di scikit-learn per trasformare questi dati prima di creare un modello. Capisco la differenza tra OHE, LabelEncodere DictVectorizorin termini di ciò che stanno facendo per i dati, ma …
La differenza chiave tra un GRU e un LSTM è che un GRU ha due gate ( reset e update gate) mentre un LSTM ha tre gate (vale a dire input , output e dimenticare gate). Perché utilizziamo il GRU quando abbiamo chiaramente un maggiore controllo sulla rete attraverso il …
Molte persone usano il termine big data in un modo piuttosto commerciale , come mezzo per indicare che nel calcolo sono coinvolti grandi set di dati, e quindi le potenziali soluzioni devono avere buone prestazioni. Naturalmente, i big data portano sempre termini associati, come scalabilità ed efficienza, ma cosa definisce …
Attualmente sto lavorando all'implementazione della Discesa stocastica del gradiente SGD, per le reti neurali che usano la propagazione di ritorno, e mentre capisco il suo scopo ho alcune domande su come scegliere i valori per il tasso di apprendimento. Il tasso di apprendimento è correlato alla forma del gradiente di …
Quando si scrive un documento / si fa una presentazione su un argomento che riguarda le reti neurali, di solito si visualizza l'architettura delle reti. Quali sono i modi buoni / semplici per visualizzare automaticamente le architetture comuni?
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.