Sto iniziando un progetto in cui il compito è identificare i tipi di sneaker dalle immagini. Attualmente sto leggendo le implementazioni di TensorFlow e Torch . La mia domanda è: quante immagini per classe sono necessarie per raggiungere una prestazione di classificazione ragionevole?
Esistono delle regole empiriche (o regole effettive) relative alla quantità minima, massima e "ragionevole" di celle LSTM che dovrei usare? In particolare mi riferisco a BasicLSTMCell di TensorFlow e num_unitsproprietà. Si prega di supporre che ho un problema di classificazione definito da: t - number of time steps n - …
Sto prototipando un'applicazione e ho bisogno di un modello linguistico per calcolare la perplessità su alcune frasi generate. Esiste un modello di linguaggio addestrato in Python che posso usare facilmente? Qualcosa di semplice come model = LanguageModel('en') p1 = model.perplexity('This is a well constructed sentence') p2 = model.perplexity('Bunny lamp robert …
Come ottimizzeresti un pre-addestrato neural network per applicarlo a un problema separato? Aggiungeresti solo più livelli al modello pre-addestrato e lo testeresti sul tuo set di dati? Ad esempio, se il compito fosse quello di utilizzare una CNN per classificare i gruppi di sfondi , sono sicuro che non avrebbe …
Queste due operazioni di convoluzione sono molto comuni nell'apprendimento profondo in questo momento. Ho letto dello strato convoluzionale dilatato in questo documento: WAVENET: UN MODELLO GENERATIVO PER AUDIO RAW e De-convoluzione è in questo documento: reti completamente convoluzionali per la segmentazione semantica Entrambi sembrano sottoporre a campionamento l'immagine, ma qual …
Sto cercando di usare la CNN (rete neurale convoluzionale) per classificare i documenti. La CNN per brevi testi / frasi è stata studiata in molti articoli. Tuttavia, sembra che nessun documento abbia usato la CNN per lunghi testi o documenti. Il mio problema è che ci sono troppe funzioni da …
Sto cercando di capire quanti pesi e distorsioni sono necessari per la CNN. Supponi di avere un'immagine (3, 32, 32) e di voler applicare un filtro (32, 5, 5). Per ogni mappa caratteristica ho pesi 5x5, quindi dovrei avere 3 parametri (5x5) x 32. Ora devo aggiungere il pregiudizio. Credo …
La maggior parte delle reti che ho visto hanno uno o due strati densi prima del livello finale di softmax. Esiste un modo di principio per scegliere il numero e la dimensione dei layer densi? Due strati densi sono più rappresentativi di uno, per lo stesso numero di parametri? Il …
Mi chiedo come interpretare un'architettura ricorrente in un contesto EEG. In particolare, sto pensando a questa come una CNN ricorrente (al contrario di architetture come LSTM), ma forse si applica anche ad altri tipi di reti ricorrenti Quando leggo degli R-CNN, di solito sono spiegati in contesti di classificazione delle …
Ho letto la spiegazione della convoluzione e la capisco fino a un certo punto. Qualcuno può aiutarmi a capire come questa operazione si collega alla convoluzione nelle reti neurali convoluzionali? È una funzione simile a un filtro gche applica peso?
Mi piacerebbe essere in grado di stimare se un modello proposto è abbastanza piccolo da essere addestrato su una GPU con una determinata quantità di memoria Se ho una semplice architettura CNN come questa: Input: 50x50x3 C1: 32 kernel 3x3, con imbottitura (immagino che in realtà siano 3x3x3 data la …
Ho due tensori a:[batch_size, dim] b:[batch_size, dim]. Voglio fare un prodotto interno per ogni coppia nel lotto, generando c:[batch_size, 1], dove c[i,0]=a[i,:].T*b[i,:]. Come?
Lavoro con l'analisi dei dati EEG, che alla fine dovranno essere classificati. Tuttavia, ottenere etichette per le registrazioni è alquanto costoso, il che mi ha portato a considerare approcci senza supervisione, per utilizzare meglio le nostre quantità piuttosto grandi di dati senza etichetta. Ciò porta naturalmente a considerare gli autocodificatori …
Attualmente sto lavorando per ricreare i risultati di questo documento . Nel documento descrivono un metodo per usare la CNN per l'estrazione delle caratteristiche e hanno un modello acustico che è Dnn-hmm e prefabbricato usando RBM. La sottosezione A della sezione III indica diversi modi in cui i dati di …
Ho avuto un'interessante discussione sulla base di un progetto a cui stavamo lavorando: perché usare un sistema di ispezione visiva della CNN su un algoritmo di corrispondenza dei modelli? Sfondo: avevo mostrato una demo di un semplice sistema di visione della CNN (webcam + laptop) che rilevava se un particolare …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.