Qual'è la differenza tra val_losse lossdurante l'allenamento in Keras? Per esempio Epoch 1/20 1000/1000 [==============================] - 1s - loss: 0.1760, val_loss: 0.2032 In alcuni siti ho letto che durante la convalida, il dropout non funzionava.
Qui la risposta si riferisce a gradienti che svaniscono ed esplodono che sono stati in sigmoidsimil-funzioni di attivazione ma, immagino, Reluha uno svantaggio ed è il suo valore atteso. non ci sono limiti per l'output di Relue quindi il suo valore atteso non è zero. Ricordo che la popolarità di …
Mi chiedo come etichettare (taggare) frasi / paragrafi / documenti con doc2vec in gensim - da un punto di vista pratico. Devi avere ogni frase / paragrafo / documento con una propria etichetta univoca (ad esempio "Sent_123")? Questo sembra utile se vuoi dire "quali parole o frasi sono più simili …
Il bagging è la generazione di più predittori che funziona come un singolo predittore. Il dropout è una tecnica che insegna a una rete neurale come media di tutte le sottoreti possibili. Osservando le più importanti competizioni di Kaggle sembra che queste due tecniche vengano usate insieme molto spesso. Non …
Ho una grande matrice sparsa di utenti e oggetti che gli piacciono (nell'ordine di 1 milione di utenti e 100.000 articoli, con un livello molto basso di scarsità). Sto esplorando i modi in cui potrei eseguire la ricerca kNN su di esso. Date le dimensioni del mio set di dati …
Ho un progetto di hobby che sto pensando di impegnarmi come un modo per aumentare la mia esperienza finora limitata di apprendimento automatico. Ho preso e completato il MOOC di Coursera sull'argomento. La mia domanda riguarda la fattibilità del progetto. L'attività è la seguente: Di tanto in tanto i gatti …
Uso Libsvm per addestrare i dati e prevedere la classificazione sul problema dell'analisi semantica . Ma ha un problema di prestazioni su dati su larga scala, perché l'analisi semantica riguarda il problema della dimensione n . L'anno scorso è stato rilasciato Liblinear e può risolvere il collo di bottiglia delle …
Considera una rete neurale: Per un determinato set di dati, li dividiamo in training, validazione e set di test. Supponiamo di farlo nel classico rapporto 60:20:20, quindi preveniamo il sovradimensionamento convalidando la rete controllandola sul set di convalida. Quindi qual è la necessità di testarlo sul set di test per …
Ho caratteristiche sparse che sono predittive, inoltre ho alcune caratteristiche dense che sono anche predittive. Devo combinare queste funzionalità insieme per migliorare le prestazioni complessive del classificatore. Ora, il problema è che quando provo a combinarli insieme, le funzioni dense tendono a dominare di più rispetto alle funzioni sparse, offrendo …
Sto facendo un progetto sul problema di identificazione dell'autore. Avevo applicato la normalizzazione tf-idf per addestrare i dati e poi ho formato un svm su quei dati. Ora, quando uso il classificatore, dovrei anche normalizzare i dati del test. Sento che l'obiettivo di base della normalizzazione è quello di far …
Sto creando un flusso di lavoro per la creazione di modelli di machine learning (nel mio caso, usando Python pandase sklearnpacchetti) da dati estratti da un database molto grande (qui, Vertica tramite SQL e pyodbc), e un passaggio fondamentale in questo processo prevede l'imputazione mancante valori dei predittori. Questo è …
Stavo leggendo un articolo sui blog di Kaggle. Ripetutamente, l'autore menziona "punteggio LB" e "adattamento LB" come metrica per l'efficacia dell'apprendimento automatico (insieme al punteggio di convalida incrociata (CV)). Con una ricerca sul significato di "LB" ho trascorso un bel po 'di tempo, mi sono reso conto che generalmente le …
Sto iniziando a imparare l'apprendimento automatico dal sito Web di Tensorflow. Ho sviluppato una comprensione molto rudimentale del flusso seguito da un programma di apprendimento profondo (questo metodo mi fa imparare velocemente invece di leggere libri e grandi articoli). Ci sono alcune cose confuse che mi sono imbattuto, 2 di …
Quali sono i tratti distintivi o le proprietà che indicano che un certo problema di apprendimento può essere affrontato utilizzando macchine vettoriali di supporto? In altre parole, cos'è che, quando vedi un problema di apprendimento, ti fa andare "oh dovrei assolutamente usare SVM per questo" 'piuttosto che reti neurali o …
So che non esiste una risposta chiara a questa domanda, ma supponiamo che io abbia una grande rete neurale, con molti dati e che voglio aggiungere una nuova funzionalità in input. Il modo "migliore" sarebbe testare la rete con la nuova funzionalità e vedere i risultati, ma esiste un metodo …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.