La capacità di riconoscimento dei pattern delle CNN è limitata all'elaborazione delle immagini?


21

Una rete neurale convoluzionale può essere utilizzata per il riconoscimento di modelli in un dominio problematico in cui non esistono immagini preesistenti, ad esempio rappresentando graficamente dati astratti? Sarebbe sempre meno efficiente?

Questo sviluppatore afferma che lo sviluppo attuale potrebbe andare oltre, ma non se ci fosse un limite al di fuori del riconoscimento delle immagini.


1
Vedo almeno due domande qui. Come pensi di separarti? Inoltre, la domanda avrebbe una qualità molto più elevata se potessi espandere ciò che hai cercato nella domanda del titolo.
Eric Platon,

@EricPlaton Lo ha rafforzato un po '. La mia domanda principale riguarda la natura della relazione tra CNN e immagini. Quale sarebbe il tuo suggerimento per la seconda domanda?
dynrepsys,

Grazie, la domanda è buona per me (anche se dovrei eliminare la mia risposta ora ~). Per quanto riguarda la seconda domanda, che ne dici di un approccio "qual è il trucco"? "È sempre meno efficiente?" va ancora bene se qualcuno può trovare un contro-esempio.
Eric Platon,

Con "Una rete neurale convoluzionale può essere utilizzata per il riconoscimento di schemi in un dominio problematico in cui non esistono immagini preesistenti, ad esempio rappresentando graficamente dati astratti?" stai chiedendo se possiamo rappresentare qualsiasi dato come immagine e applicare una CNN? Come leggere un set di dati con 100 funzioni e rappresentarlo come un'immagine 10x10?
rcpinto,

Risposte:


10

Le reti convoluzionali (CNN) si basano sulla convoluzione matematica (ad es. Convoluzioni 2D o 3D), che viene comunemente utilizzata per l'elaborazione del segnale. Le immagini sono un tipo di segnale e la convoluzione può essere utilizzata anche su suono, vibrazioni, ecc. Quindi, in linea di principio, le CNN possono trovare applicazioni per qualsiasi segnale, e probabilmente di più.

In pratica, esiste già un lavoro sulla PNL (come menzionato da Matthew Graves), in cui alcune persone elaborano testo con CNN piuttosto che reti ricorsive. Alcune altre opere si applicano all'elaborazione del suono (nessun riferimento qui, ma ho ancora lavori inediti in corso).


Contenuti originali: in risposta alla domanda del titolo originale, che ora è cambiata. Forse è necessario eliminare questo .

La ricerca sulle reti contraddittorie (e relative) mostra che anche le reti profonde possono essere facilmente ingannate , portandole a vedere un cane (o qualunque oggetto) in quello che sembra essere un rumore casuale quando un umano lo guarda (l'articolo ha chiari esempi).

Un altro problema è il potere di generalizzazione di una rete neurale. Le reti convoluzionali hanno stupito il mondo con la loro capacità di generalizzare in modo migliore rispetto ad altre tecniche. Ma se la rete è alimentata solo con immagini di gatti, riconoscerà solo i gatti (e probabilmente vedrà i gatti ovunque, come dai risultati della rete contraddittoria). In altre parole, anche i CN hanno difficoltà a generalizzare troppo oltre ciò che hanno imparato.

Il limite di riconoscimento è difficile da definire con precisione. Direi semplicemente che la diversità dei dati di apprendimento spinge il limite (presumo che ulteriori dettagli dovrebbero portare a una sede più appropriata per la discussione).


5

La semplice risposta è "no, non si limitano alle immagini": le CNN vengono utilizzate anche per l'elaborazione del linguaggio naturale. (Vedi qui per un'introduzione.)

Non li ho ancora visti applicati ai dati grafici, ma non li ho guardati; ci sono alcune cose ovvie da provare e quindi sono ottimista sul fatto che funzionerebbe.


3

La rete neurale convoluzionale può essere applicata non solo per il riconoscimento delle immagini ma anche per l'analisi e il riconoscimento dei video, l'elaborazione del linguaggio naturale, nei giochi (ad esempio Go ) o persino per la scoperta di droghe predicendo l'interazione tra molecole e wiki delle proteine ​​biologiche .

Pertanto, può essere utilizzato per vari problemi utilizzando strati convoluzionali e di campionamento secondario collegati a livelli più completamente connessi. Sono più facili da addestrare, perché hanno meno parametri rispetto alle reti completamente connesse con lo stesso numero di unità nascoste. UFLDL


3

Una rete neurale convoluzionale può essere utilizzata ovunque i modelli siano localmente correlati e traducibili (come in shiftable). Questo è il caso perché le CNN contengono filtri che cercano determinati modelli locali ovunque nell'input. Troverai modelli locali e traducibili in immagini, testo, serie storiche, ecc.

Non ha molto senso usare le CNN se i tuoi dati sono più simili a una serie di funzionalità con un ordine irrilevante. In tal caso, potresti riscontrare problemi nel rilevare modelli che contengono funzionalità che risultano essere più distanti nel vettore di input. Non troverai schemi locali e traducibili nei tuoi dati se puoi riordinare i punti dati dei vettori di input senza perdere informazioni.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.