Ho un paio di domande che mi confondono riguardo alla CNN. 1) Le funzionalità estratte utilizzando CNN sono invarianti di scala e rotazione? 2) I kernel che utilizziamo per la convoluzione con i nostri dati sono già definiti in letteratura? che tipo di questi kernel sono? è diverso per ogni …
Possiamo fornire immagini di dimensioni variabili come input per una rete neurale convoluzionale per il rilevamento di oggetti? Se possibile, come possiamo farlo? Ma se proviamo a ritagliare l'immagine, perderemo una parte dell'immagine e se proviamo a ridimensionare, allora la chiarezza dell'immagine andrà persa. Significa che l'uso della proprietà di …
Background: molta della ricerca moderna negli ultimi 4 anni (post alexnet ) sembra essersi allontanata dall'uso della pre-generazione generativa per le reti neurali per ottenere risultati di classificazione all'avanguardia. Ad esempio, i migliori risultati per mnist qui includono solo 2 articoli dei primi 50 che sembrano usare modelli generativi, entrambi …
Quando apprendo la rete neurale convoluzionale, ho domande riguardanti la figura seguente. 1) C1 nel layer 1 ha 6 mappe caratteristiche, significa che ci sono sei kernel convoluzionali? Ogni kernel convoluzionale viene utilizzato per generare una mappa delle caratteristiche basata sull'input. 2) S1 nel livello 2 ha 6 mappe caratteristiche, …
Sto studiando reti neurali convoluzionali (CNN) a causa delle loro applicazioni nella visione artificiale. Ho già familiarità con le reti neurali standard feed-foward, quindi spero che alcune persone qui possano aiutarmi a fare un passo in più nella comprensione delle CNN. Ecco cosa penso delle CNN: Nei tradizionali NN feed-foward, …
Cosa trasmette il numero di filtri in uno strato di convoluzione? In che modo questo numero influisce sulle prestazioni o sulla qualità dell'architettura? Voglio dire dovremmo sempre optare per un numero maggiore di filtri? cosa c'è di buono in loro? e in che modo le persone assegnano un numero diverso …
Sto addestrando una rete neurale usando i) SGD e ii) Adam Optimizer. Quando utilizzo SGD normale, ottengo una perdita di allenamento regolare rispetto alla curva di iterazione come mostrato di seguito (quella rossa). Tuttavia, quando ho usato Adam Optimizer, la curva di perdita dell'allenamento presenta alcuni picchi. Qual è la …
Sto esaminando l'utilizzo di una versione LSTM ( memoria a breve termine ) di una rete neurale ricorrente (RNN) per la modellazione dei dati di serie temporali. All'aumentare della lunghezza della sequenza dei dati, aumenta la complessità della rete. Sono quindi curioso di sapere quale lunghezza delle sequenze sarebbe possibile …
Mentre approfondiamo la letteratura sulle reti neurali , possiamo identificare altri metodi con topologie neuromorfe (architetture simili a "reti neurali"). E non sto parlando del teorema di approssimazione universale . Di seguito sono riportati degli esempi. Quindi, mi chiedo: qual è la definizione di una rete neurale artificiale? La sua …
Non ho trovato una risposta soddisfacente a questo da Google . Naturalmente se i dati che ho sono dell'ordine di milioni, l'apprendimento profondo è la strada. E ho letto che quando non ho i big data allora forse è meglio usare altri metodi nell'apprendimento automatico. Il motivo indicato è eccessivo. …
Sto cercando di imparare come usare le reti neurali. Stavo leggendo questo tutorial . Dopo aver inserito una Rete Neurale su una serie temporale utilizzando il valore in per prevedere il valore in l'autore ottiene il seguente grafico, dove la linea blu è la serie storica, il verde è la …
A che punto iniziamo a classificare le reti neurali a più strati come reti neurali profonde o per dirlo in un altro modo "Qual è il numero minimo di strati in una rete neurale profonda?"
Ho letto molto sulle reti neurali convolutive e mi chiedevo come evitare il problema del gradiente in via di estinzione. So che le reti di credenze profonde impilano autocodificatori a livello singolo o altre reti poco profonde pre-addestrate e posso quindi evitare questo problema, ma non so come evitarlo nelle …
http://www.deeplearningbook.org/contents/ml.html Pagina 116 spiega l'errore bayes come di seguito Il modello ideale è un oracolo che conosce semplicemente la vera distribuzione di probabilità che genera i dati. Anche un modello del genere comporterà comunque un errore su molti problemi, perché potrebbe esserci ancora del rumore nella distribuzione. Nel caso dell'apprendimento …
Sto cercando di realizzare un progetto di riconoscimento ottico dei caratteri (OCR). Dopo aver fatto qualche ricerca mi sono imbattuto in un'architettura che sembra interessante: CNN + RNN + CTC. Ho familiarità con le reti neurali contorte (CNN) e le reti neurali ricorrenti (RNN), ma cos'è la classificazione temporale dei …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.