Di recente ho letto Reti pienamente convoluzionali per la segmentazione semantica di Jonathan Long, Evan Shelhamer, Trevor Darrell. Non capisco cosa fanno gli "strati deconvoluzionali" / come funzionano. La parte rilevante è 3.3. Upsampling è una convoluzione guidata all'indietro Un altro modo per collegare output grossolani a pixel densi è …
Di recente ho letto il commento di Yan LeCuns su convoluzioni 1x1 : Nelle reti convoluzionali non esistono "livelli completamente connessi". Esistono solo livelli di convoluzione con kernel convoluzione 1x1 e una tabella di connessione completa. È un fatto troppo raro che ConvNets non abbia bisogno di un input di …
Vorrei utilizzare una rete neurale per la classificazione delle immagini. Inizierò con CaffeNet pre-addestrato e lo addestrerò per la mia applicazione. Come devo preparare le immagini di input? In questo caso, tutte le immagini sono dello stesso oggetto ma con variazioni (pensate: controllo di qualità). Sono in scale / risoluzioni …
Questa domanda si riduce a "come funzionano esattamente i livelli di convoluzione . Supponiamo che io abbia un'immagine in scala di grigi . Quindi l'immagine ha un canale. Nel primo strato, applico una convoluzione 3 × 3 con k 1 filtri e riempimento. Poi ho un altro livello di convoluzione …
Ho sentito spesso persone dire che il motivo per cui le reti neurali convoluzionali sono ancora poco comprese. È noto perché le reti neurali convoluzionali finiscono sempre per apprendere caratteristiche sempre più sofisticate mentre saliamo di livello? Cosa li ha spinti a creare una tale serie di funzionalità e questo …
Durante l'allenamento delle reti neurali, un iperparametro ha le dimensioni di un mini-batch. Le scelte comuni sono 32, 64 e 128 elementi per mini batch. Ci sono regole / linee guida su quanto dovrebbe essere grande un mini-batch? Qualche pubblicazione che indaga l'effetto sulla formazione?
L'articolo che approfondisce le convoluzioni descrive GoogleNet che contiene i moduli di inizio originali: La modifica a Inception v2 è stata che hanno sostituito le convoluzioni 5x5 con due successive convoluzioni 3x3 e applicato il pool: Qual è la differenza tra Inception v2 e Inception v3?
Sono piuttosto nuovo alle reti neurali, ma capisco abbastanza bene l'algebra lineare e la matematica della convoluzione. Sto cercando di capire il codice di esempio che trovo in vari punti della rete per addestrare un NN convoluzionale di Keras con dati MNIST per riconoscere le cifre. La mia aspettativa sarebbe …
Sto giocando un po 'con le convnet. In particolare, sto usando il set di dati Kaggle Gatti contro cani che consiste in 25000 immagini etichettate come gatto o cane (12500 ciascuna). Sono riuscito a raggiungere un'accuratezza della classificazione dell'85% circa sul mio set di test, tuttavia ho fissato un obiettivo …
Creo un corr()df da un df originale. Il corr()df è venuto fuori 70 X 70 ed è impossibile visualizzare il heatmap ... sns.heatmap(df). Se provo a visualizzare il corr = df.corr(), la tabella non si adatta allo schermo e posso vedere tutte le correlazioni. È un modo per stampare l'intero …
Ho la seguente CNN: Comincio con un'immagine di input di dimensioni 5x5 Quindi applico la convoluzione usando il kernel 2x2 e stride = 1, che produce una mappa delle caratteristiche di dimensioni 4x4. Quindi applico 2x2 max-pooling con stride = 2, che riduce la mappa delle caratteristiche a dimensioni 2x2. …
Se guardo una delle molte fonti per le lezioni di Imagenet su Internet non riesco a trovare una sola classe legata agli esseri umani (e no, Harvestman non è qualcuno che raccoglie, ma è quello che sapevo come un papà longlegs, una specie di ragno :-). Come è possibile? Vorrei …
Sto cercando di capire questo documento e non sono sicuro di cosa sia il upsampling bi-lineare. Qualcuno può spiegare questo ad alto livello? https://arxiv.org/abs/1606.00915
Ho una piccola domanda secondaria a questa domanda . Capisco che quando si propaga indietro attraverso uno strato di pool massimo il gradiente viene instradato indietro in modo tale che il neurone nel livello precedente che è stato selezionato come max ottenga tutto il gradiente. Ciò di cui non sono …
Se diamo uno sguardo al 90-99% dei lavori pubblicati utilizzando una CNN (ConvNet). La stragrande maggioranza di essi utilizza le dimensioni del filtro per i numeri dispari : {1, 3, 5, 7} per i più utilizzati. Questa situazione può comportare alcuni problemi: con queste dimensioni di filtro, di solito l'operazione …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.