Domande e risposte per i professionisti della scienza dei dati, gli specialisti di Machine Learning e coloro che sono interessati a saperne di più sul campo
Abbiamo creato un'applicazione di social network per scopi di e-learning. È un progetto sperimentale su cui stiamo effettuando ricerche nel nostro laboratorio. È stato usato in alcuni casi di studio per un po 'di tempo e i dati nel nostro DBMS relazionale (SQL Server 2008) stanno diventando grandi. Sono pochi …
La suddivisione della convalida nella funzione di adattamento del modello sequenziale di Keras è documentata come segue su https://keras.io/models/sequential/ : validation_split: Float tra 0 e 1. Frazione dei dati di allenamento da utilizzare come dati di validazione. Il modello separerà questa frazione dei dati di addestramento, non si allenerà su …
Considera una rete neurale: Per un determinato set di dati, li dividiamo in training, validazione e set di test. Supponiamo di farlo nel classico rapporto 60:20:20, quindi preveniamo il sovradimensionamento convalidando la rete controllandola sul set di convalida. Quindi qual è la necessità di testarlo sul set di test per …
Sto cercando di calcolare la quantità di memoria necessaria a una GPU per addestrare il mio modello sulla base di queste note di Andrej Karphaty: http://cs231n.github.io/convolutional-networks/#computational-considerations La mia rete ha 532.752 attivazioni e 19.072.984 parametri (pesi e distorsioni). Questi sono tutti valori float a 32 bit, quindi ognuno richiede 4 …
Mi chiedo se ci siano euristiche sul numero di caratteristiche rispetto al numero di osservazioni. Ovviamente, se un numero di funzioni è uguale al numero di osservazioni, il modello si adatta in modo eccessivo. Utilizzando metodi sparsi (LASSO, rete elastica) possiamo rimuovere diverse funzionalità per ridurre il modello. La mia …
Sto incontrando qualche difficoltà nel ricavare la propagazione indietro con ReLU e ho fatto un po 'di lavoro, ma non sono sicuro di essere sulla strada giusta. Funzione di costo: dove è il valore reale e è un valore previsto. Supponi anche che > 0 sempre.y y x12(y−y^)212(y−y^)2\frac{1}{2}(y-\hat y)^2yyyy^y^\hat yxxx …
Sto lavorando al riconoscimento vocale con Tensorflow e sto pianificando di addestrare LSTM NN con un set di dati ad onde enormi. A causa degli aumenti delle prestazioni, ho intenzione di utilizzare tfrecords. Ci sono molti esempi su Internet (Inception per es.) In cui i file di tfrecords sono divisi …
Ho caratteristiche sparse che sono predittive, inoltre ho alcune caratteristiche dense che sono anche predittive. Devo combinare queste funzionalità insieme per migliorare le prestazioni complessive del classificatore. Ora, il problema è che quando provo a combinarli insieme, le funzioni dense tendono a dominare di più rispetto alle funzioni sparse, offrendo …
Sto facendo un progetto sul problema di identificazione dell'autore. Avevo applicato la normalizzazione tf-idf per addestrare i dati e poi ho formato un svm su quei dati. Ora, quando uso il classificatore, dovrei anche normalizzare i dati del test. Sento che l'obiettivo di base della normalizzazione è quello di far …
Esiste un pacchetto open source completo (preferibilmente in Python o R) che può essere utilizzato per il rilevamento di anomalie nelle serie temporali? Esiste un pacchetto SVM di una classe in scikit-learn ma non è per i dati di serie temporali. Sto cercando pacchetti più sofisticati che, ad esempio, utilizzano …
Qualcuno può pubblicare un semplice esempio di Keras usando un callback per salvare un modello dopo ogni epoca? Posso trovare esempi di risparmio di pesi, ma voglio essere in grado di salvare un modello completamente funzionante dopo ogni epoca di allenamento.
Come posso ottenere il numero di valore mancante in ogni riga nel frame di dati di Pandas. Vorrei dividere i frame di dati in frame di dati diversi che hanno lo stesso numero di valori mancanti in ogni riga. Qualche suggerimento?
Ho un set di dati con 3 classi con i seguenti elementi: Classe 1: 900 elementi Classe 2: 15000 elementi Classe 3: 800 elementi Devo prevedere la classe 1 e la classe 3, che segnalano importanti deviazioni dalla norma. La classe 2 è il caso "normale" predefinito che non mi …
Sto creando un flusso di lavoro per la creazione di modelli di machine learning (nel mio caso, usando Python pandase sklearnpacchetti) da dati estratti da un database molto grande (qui, Vertica tramite SQL e pyodbc), e un passaggio fondamentale in questo processo prevede l'imputazione mancante valori dei predittori. Questo è …
Sono consapevole che Keras funge da interfaccia di alto livello con TensorFlow. Ma mi sembra che le keras possano svolgere molte funzionalità da sole (input di dati, creazione di modelli, formazione, valutazione). Inoltre, alcune delle funzionalità di TensorFlow possono essere trasferite direttamente alle telecamere (ad es. È possibile utilizzare una …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.