Domande e risposte per i professionisti della scienza dei dati, gli specialisti di Machine Learning e coloro che sono interessati a saperne di più sul campo
Sto cercando di cercare una buona argomentazione sul perché si dovrebbe usare la distanza di Manhattan sulla distanza euclidea in Machine Learning. La cosa più vicina che ho trovato ad una buona discussione finora è su questa lezione del MIT . Alle 36:15 puoi vedere nelle diapositive la seguente dichiarazione: …
L'articolo che approfondisce le convoluzioni descrive GoogleNet che contiene i moduli di inizio originali: La modifica a Inception v2 è stata che hanno sostituito le convoluzioni 5x5 con due successive convoluzioni 3x3 e applicato il pool: Qual è la differenza tra Inception v2 e Inception v3?
Sto lavorando a una sfida di Kaggle in cui alcune variabili sono rappresentate da righe anziché da colonne (interruzione della rete Telstra). Attualmente sto cercando l'equivalente di gather (), separate () e spread (), che si trova nello strumento R tidyr.
Uso reti neurali da un po 'di tempo. Tuttavia, una cosa con cui continuo a lottare è la selezione di un ottimizzatore per allenare la rete (usando backprop). Quello che faccio di solito è solo iniziare con uno (ad esempio SGD standard) e poi provare altri altri in modo quasi …
Sono piuttosto nuovo alle reti neurali, ma capisco abbastanza bene l'algebra lineare e la matematica della convoluzione. Sto cercando di capire il codice di esempio che trovo in vari punti della rete per addestrare un NN convoluzionale di Keras con dati MNIST per riconoscere le cifre. La mia aspettativa sarebbe …
Da Keras RNN Tutorial: "Gli RNN sono difficili. La scelta della dimensione del batch è importante, la scelta della perdita e l'ottimizzatore sono fondamentali, ecc. Alcune configurazioni non convergono." Quindi questa è più una domanda generale sull'ottimizzazione degli iperparametri di un LSTM-RNN su Keras. Vorrei sapere un approccio per trovare …
Nella mia classe devo creare un'applicazione usando due classificatori per decidere se un oggetto in un'immagine è un esempio di phylum porifera (spugna di mare) o qualche altro oggetto. Tuttavia, mi sono completamente perso quando si tratta di tecniche di estrazione in Python. Il mio consulente mi ha convinto a …
Se ho un negozio al dettaglio e ho un modo per misurare quante persone entrano nel mio negozio ogni minuto, e il timestamp di tali dati, come posso prevedere il traffico pedonale futuro? Ho esaminato gli algoritmi di machine learning, ma non sono sicuro di quale utilizzare. Nei miei dati …
Ho due frasi, S1 e S2, entrambe con un conteggio delle parole (di solito) inferiore a 15. Quali sono gli algoritmi più utili e di successo (machine learning), che sono probabilmente facili da implementare (la rete neurale è ok, a meno che l'architettura non sia complicata come Google Inception ecc.). …
Ho sentito Andrew Ng (in un video che purtroppo non riesco più a trovare) parlare di come la comprensione dei minimi locali nei problemi di apprendimento profondo è cambiata nel senso che ora sono considerati meno problematici perché in spazi ad alta dimensione (incontrati in deep learning) è più probabile …
Sto cercando di rimuovere le parole di arresto prima di eseguire la modellazione degli argomenti. Ho notato che alcune parole di negazione (no, né mai, nessuna, ecc.) Sono generalmente considerate parole di stop. Ad esempio, NLTK, spacy e sklearn includono "non" nei loro elenchi di parole di arresto. Tuttavia, se …
Vorrei ridurre la dimensionalità su quasi 1 milione di vettori ciascuno con 200 dimensioni ( doc2vec). Sto usando l' TSNEimplementazione dal sklearn.manifoldmodulo per questo e il problema principale è la complessità temporale. Anche con method = barnes_hut, la velocità di calcolo è ancora bassa. Qualche volta anche la memoria si …
Stavo esaminando il documento BERT che utilizza GELU (Gaussian Error Linear Unit) che indica l'equazione come che a sua volta è approssimato aGELU(x)=xP(X≤x)=xΦ(x).GELU(x)=xP(X≤x)=xΦ(x). GELU(x) = xP(X ≤ x) = xΦ(x).0.5x(1+tanh[2/π−−−√(x+0.044715x3)])0.5x(1+tanh[2/π(x+0.044715x3)])0.5x(1 + tanh[\sqrt{ 2/π}(x + 0.044715x^3)]) Potresti semplificare l'equazione e spiegare come è stata approssimata.
Cerco di capire il ruolo della derivata della funzione sigmoidea nelle reti neurali. Per prima cosa ho tracciato la funzione sigmoide e la derivata di tutti i punti dalla definizione usando Python. Qual è esattamente il ruolo di questo derivato? import numpy as np import matplotlib.pyplot as plt def sigmoid(x): …
Qual'è la differenza tra val_losse lossdurante l'allenamento in Keras? Per esempio Epoch 1/20 1000/1000 [==============================] - 1s - loss: 0.1760, val_loss: 0.2032 In alcuni siti ho letto che durante la convalida, il dropout non funzionava.
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.