Scienza dei dati

Domande e risposte per i professionisti della scienza dei dati, gli specialisti di Machine Learning e coloro che sono interessati a saperne di più sul campo

4
Perché l'aggiunta di un livello di dropout migliora le prestazioni di deep / machine learning, dato che il dropout elimina alcuni neuroni dal modello?
Se la rimozione di alcuni neuroni si traduce in un modello con prestazioni migliori, perché non utilizzare in primo luogo una rete neurale più semplice con meno strati e meno neuroni? Perché costruire un modello più grande e complicato all'inizio e sopprimerne parti in seguito?

3
Cosa sono gli incorporamenti dei grafici?
Di recente mi sono imbattuto in un incorporamento grafico come DeepWalk e LINE. Tuttavia, non ho ancora un'idea chiara di cosa significhino gli incastri grafici e quando utilizzarli (applicazioni)? Eventuali suggerimenti sono benvenuti!
13 graphs 





1
Come dovrebbe essere inizializzato e regolarizzato il bias?
Ho letto un paio di articoli sull'inizializzazione del kernel e molti articoli menzionano che usano la regolarizzazione L2 del kernel (spesso con ).λ = 0,0001λ=0.0001\lambda = 0.0001 Qualcuno fa qualcosa di diverso dall'inizializzare il bias con zero costante e non regolarizzarlo? Documenti di inizializzazione del kernel Mishkin e Matas: tutto …


1
Dimentica il livello in una rete neurale ricorrente (RNN) -
Sto cercando di capire le dimensioni di ciascuna variabile in un RNN nel livello di dimenticanza, tuttavia, non sono sicuro di essere sulla strada giusta. L'immagine e l'equazione successive sono tratte dal post sul blog di Colah "Capire le reti LSTM" : dove: xtxtx_t è un input di dimensione vettorem∗1m∗1m*1 …

3
Perché contorto se Max Pooling sta per sottocampionare l'immagine comunque?
L'idea di applicare filtri per fare qualcosa come identificare i bordi, è un'idea piuttosto interessante. Ad esempio, è possibile acquisire un'immagine di un 7. Con alcuni filtri, è possibile ottenere immagini trasformate che enfatizzano le diverse caratteristiche dell'immagine originale. L'originale 7: può essere sperimentato dalla rete come: Notare come ogni …




2
Scalabilità dei dati in modo etico ed economico
Poche cose nella vita mi fanno piacere come scartare dati strutturati e non strutturati da Internet e usarli nei miei modelli. Ad esempio, il Data Science Toolkit (o RDSTKper i programmatori R) mi consente di estrarre molti buoni dati basati sulla posizione utilizzando IP o indirizzi e il pacchetto tm.webmining.pluginfor …


Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.