Scienza dei dati

4

Quando si usa la distanza di Manhattan come opposta alla distanza euclidea?

Sto cercando di cercare una buona argomentazione sul perché si dovrebbe usare la distanza di Manhattan sulla distanza euclidea in Machine Learning. La cosa più vicina che ho trovato ad una buona discussione finora è su questa lezione del MIT . Alle 36:15 puoi vedere nelle diapositive la seguente dichiarazione: …

18 machine-learning classification distance

4

Qual è la differenza tra Inception v2 e Inception v3?

L'articolo che approfondisce le convoluzioni descrive GoogleNet che contiene i moduli di inizio originali: La modifica a Inception v2 è stata che hanno sostituito le convoluzioni 5x5 con due successive convoluzioni 3x3 e applicato il pool: Qual è la differenza tra Inception v2 e Inception v3?

18 image-classification convnet computer-vision inception

3

esiste uno strumento di riordino dei dati per python / panda simile allo strumento R tidyr?

Sto lavorando a una sfida di Kaggle in cui alcune variabili sono rappresentate da righe anziché da colonne (interruzione della rete Telstra). Attualmente sto cercando l'equivalente di gather (), separate () e spread (), che si trova nello strumento R tidyr.

18 r python dataset data-cleaning pandas

3

Linee guida per la selezione di un ottimizzatore per l'addestramento delle reti neurali

Uso reti neurali da un po 'di tempo. Tuttavia, una cosa con cui continuo a lottare è la selezione di un ottimizzatore per allenare la rete (usando backprop). Quello che faccio di solito è solo iniziare con uno (ad esempio SGD standard) e poi provare altri altri in modo quasi …

18 neural-network optimization backpropagation

2

Quali sono / sono i filtri predefiniti utilizzati da Keras Convolution2d ()?

Sono piuttosto nuovo alle reti neurali, ma capisco abbastanza bene l'algebra lineare e la matematica della convoluzione. Sto cercando di capire il codice di esempio che trovo in vari punti della rete per addestrare un NN convoluzionale di Keras con dati MNIST per riconoscere le cifre. La mia aspettativa sarebbe …

18 convnet keras

4

Ricerca di iperparametri per LSTM-RNN usando Keras (Python)

Da Keras RNN Tutorial: "Gli RNN sono difficili. La scelta della dimensione del batch è importante, la scelta della perdita e l'ottimizzatore sono fondamentali, ecc. Alcune configurazioni non convergono." Quindi questa è più una domanda generale sull'ottimizzazione degli iperparametri di un LSTM-RNN su Keras. Vorrei sapere un approccio per trovare …

18 python neural-network deep-learning keras hyperparameter

3

Estrazione delle caratteristiche delle immagini in Python

Nella mia classe devo creare un'applicazione usando due classificatori per decidere se un oggetto in un'immagine è un esempio di phylum porifera (spugna di mare) o qualche altro oggetto. Tuttavia, mi sono completamente perso quando si tratta di tecniche di estrazione in Python. Il mio consulente mi ha convinto a …

18 python feature-extraction image-recognition

7

Come posso prevedere il traffico in base ai dati delle serie storiche precedenti?

Se ho un negozio al dettaglio e ho un modo per misurare quante persone entrano nel mio negozio ogni minuto, e il timestamp di tali dati, come posso prevedere il traffico pedonale futuro? Ho esaminato gli algoritmi di machine learning, ma non sono sicuro di quale utilizzare. Nei miei dati …

18 machine-learning time-series

5

Il miglior algoritmo pratico per la somiglianza delle frasi

Ho due frasi, S1 e S2, entrambe con un conteggio delle parole (di solito) inferiore a 15. Quali sono gli algoritmi più utili e di successo (machine learning), che sono probabilmente facili da implementare (la rete neurale è ok, a meno che l'architettura non sia complicata come Google Inception ecc.). …

18 nlp clustering word2vec similarity

2

minimi locali vs punti di sella nell'apprendimento profondo

Ho sentito Andrew Ng (in un video che purtroppo non riesco più a trovare) parlare di come la comprensione dei minimi locali nei problemi di apprendimento profondo è cambiata nel senso che ora sono considerati meno problematici perché in spazi ad alta dimensione (incontrati in deep learning) è più probabile …

18 machine-learning deep-learning optimization convergence

1

PNL - perché "non" una parola d'arresto?

Sto cercando di rimuovere le parole di arresto prima di eseguire la modellazione degli argomenti. Ho notato che alcune parole di negazione (no, né mai, nessuna, ecc.) Sono generalmente considerate parole di stop. Ad esempio, NLTK, spacy e sklearn includono "non" nei loro elenchi di parole di arresto. Tuttavia, se …

18 nlp topic-model sentiment-analysis

4

Migliora la velocità dell'implementazione di t-sne in Python per dati enormi

Vorrei ridurre la dimensionalità su quasi 1 milione di vettori ciascuno con 200 dimensioni ( doc2vec). Sto usando l' TSNEimplementazione dal sklearn.manifoldmodulo per questo e il problema principale è la complessità temporale. Anche con method = barnes_hut, la velocità di calcolo è ancora bassa. Qualche volta anche la memoria si …

18 python bigdata nlp scikit-learn dimensionality-reduction

2

Che cos'è l'attivazione GELU?

Stavo esaminando il documento BERT che utilizza GELU (Gaussian Error Linear Unit) che indica l'equazione come che a sua volta è approssimato aGELU(x)=xP(X≤x)=xΦ(x).GELU(x)=xP(X≤x)=xΦ(x). GELU(x) = xP(X ≤ x) = xΦ(x).0.5x(1+tanh[2/π−−−√(x+0.044715x3)])0.5x(1+tanh[2/π(x+0.044715x3)])0.5x(1 + tanh[\sqrt{ 2/π}(x + 0.044715x^3)]) Potresti semplificare l'equazione e spiegare come è stata approssimata.

18 activation-function bert mathematics

4

Derivato del ruolo della funzione sigmoidea nelle reti neurali

Cerco di capire il ruolo della derivata della funzione sigmoidea nelle reti neurali. Per prima cosa ho tracciato la funzione sigmoide e la derivata di tutti i punti dalla definizione usando Python. Qual è esattamente il ruolo di questo derivato? import numpy as np import matplotlib.pyplot as plt def sigmoid(x): …

18 machine-learning neural-network

1

La differenza di Keras tra val_loss e perdita durante l'allenamento

Qual'è la differenza tra val_losse lossdurante l'allenamento in Keras? Per esempio Epoch 1/20 1000/1000 [==============================] - 1s - loss: 0.1760, val_loss: 0.2032 In alcuni siti ho letto che durante la convalida, il dropout non funzionava.

18 machine-learning deep-learning keras