Sto usando Neural Networks per risolvere diversi problemi di machine learning. Sto usando Python e pybrain ma questa libreria è quasi fuori produzione. Ci sono altre buone alternative in Python?
Facendo riferimento alle note del corso di Stanford su Convolutional Neural Networks for Visual Recognition , un paragrafo dice: "Sfortunatamente, le unità ReLU possono essere fragili durante l'allenamento e possono" morire ". Ad esempio, una grande pendenza che fluisce attraverso un neurone ReLU potrebbe far aggiornare i pesi in modo …
Nel MNIST per principianti ML definiscono l'entropia incrociata come Hy′(y):=−∑iy′ilog(yi)Hy′(y):=−∑iyi′log(yi)H_{y'} (y) := - \sum_{i} y_{i}' \log (y_i) yiyiy_i è il valore di probabilità previsto per la classe e è la vera probabilità per quella classe.iiiy′iyi′y_i' Domanda 1 Non è un problema che (in ) possa essere 0? Ciò significherebbe che …
Ho appena iniziato a sviluppare un'applicazione di apprendimento automatico per scopi accademici. Attualmente sto usando R e mi sto allenando. Tuttavia, in molti posti, ho visto persone che usano Python . Cosa usano le persone nel mondo accademico e nell'industria e qual è la raccomandazione?
Attualmente sto lavorando all'implementazione della Discesa stocastica del gradiente SGD, per le reti neurali che usano la propagazione di ritorno, e mentre capisco il suo scopo ho alcune domande su come scegliere i valori per il tasso di apprendimento. Il tasso di apprendimento è correlato alla forma del gradiente di …
Quando si scrive un documento / si fa una presentazione su un argomento che riguarda le reti neurali, di solito si visualizza l'architettura delle reti. Quali sono i modi buoni / semplici per visualizzare automaticamente le architetture comuni?
Ho costruito il mio modello. Ora voglio disegnare il diagramma dell'architettura di rete per il mio documento di ricerca. L'esempio è mostrato di seguito:
Sto appena iniziando con l'apprendimento automatico e fino ad ora ho avuto a che fare con una regressione lineare su una variabile. Ho imparato che esiste un'ipotesi, che è: hθ(x)=θ0+θ1xhθ(x)=θ0+θ1xh_\theta(x)=\theta_0+\theta_1x Per scoprire buoni valori per i parametri e vogliamo minimizzare la differenza tra il risultato calcolato e il risultato effettivo …
Qualcuno può praticamente spiegare la logica alla base dell'impurità di Gini rispetto al guadagno di informazioni (basato sull'entropia)? Quale metrica è meglio usare in diversi scenari mentre si usano gli alberi delle decisioni?
Quali sono le eventuali differenze tra un "data scientist" e un "machine learning engineer"? Nel corso dell'ultimo anno, "l'ingegnere dell'apprendimento automatico" ha iniziato a farsi notare nelle offerte di lavoro. Ciò è particolarmente evidente a San Francisco, che è probabilmente l'origine del termine "scienziato dei dati". A un certo punto …
Stavo iniziando a esaminare l'area sotto la curva (AUC) e sono un po 'confuso per la sua utilità. Quando mi è stato spiegato per la prima volta, l'AUC sembrava essere una grande misura delle prestazioni, ma nella mia ricerca ho scoperto che alcuni sostengono che il suo vantaggio è per …
Sto riscontrando alcuni problemi su un'applicazione dell'albero decisionale / foresta casuale. Sto cercando di adattare un problema che ha numeri e stringhe (come il nome del paese) come funzionalità. Ora la libreria, scikit-learn prende solo i numeri come parametri, ma voglio iniettare le stringhe oltre a portare una notevole quantità …
Contesto del problema: sto lavorando a un progetto che prevede file di registro simili a quelli presenti nello spazio di monitoraggio IT (per la mia migliore comprensione dello spazio IT). Questi file di registro sono dati di serie temporali, organizzati in centinaia / migliaia di righe di vari parametri. Ogni …
Come potrei dividere casualmente una matrice di dati e il corrispondente vettore di etichetta in X_train, X_test, X_val, y_train, y_test, y_val con Sklearn? Per quanto ne so, sklearn.cross_validation.train_test_splitè solo in grado di dividersi in due, non in tre ...
Ho pensato alle reti neuronali ricorrenti (RNN) e alle loro varietà e alle reti neurali convoluzionali (CNN) e alle loro varietà. Sarebbe giusto dire questi due punti: Utilizzare le CNN per suddividere un componente (come un'immagine) in sottocomponenti (come un oggetto in un'immagine, come il contorno dell'oggetto nell'immagine, ecc.) Utilizzare …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.