Reti neurali profonde - Solo per la classificazione delle immagini?


14

Tutti gli esempi che ho trovato usando convinzioni profonde o reti neurali convoluzionali li usano per la classificazione delle immagini, il rilevamento dei chatacter o il riconoscimento vocale.

Le reti neurali profonde sono utili anche per le attività di regressione classica, in cui le caratteristiche non sono strutturate (ad esempio, non sono organizzate in una sequenza o griglia)? Se sì, puoi fare un esempio?


3
La tua prima frase fa apparire reti neurali convoluzionali. Sembra che tu li stia confondendo con reti di credenze profonde. Non sono gli stessi, sebbene entrambe siano forme di reti neurali.
Salterio

1
Concordo con @msalters, ma direi che le reti di credenze profonde sono reti davvero profonde e hanno avuto un successo limitato, mentre le reti convoluzionali sono più simili a un ibrido - i filtri di immagine adattativi sono in strati convoluzionali seguiti da shallow nn.
seanv507,

Cosa intendi con "osservazioni" non "strutturate (non disposte in sequenza o griglia)"? Ti riferisci alle immagini "strutturate", nel senso che i singoli pixel sono disposti su una griglia? Ma poi sono le caratteristiche che sono "strutturate", non "osservazioni" (quelle sarebbero singole immagini)?
ameba dice Ripristina Monica il

Direi che tutte le reti di convoluzione sono profonde, non tutte sono reti profonde sono convoluzione e allo stesso modo tutte le reti di credenze profonde sono profonde, non tutte le reti profonde sono reti di credenze profonde. In effetti puoi avere reti profonde che non sono né profonde né convoluzionali, tendono solo ad essere difficili da addestrare. Vi è certamente spazio per un dibattito inutile sulla terminologia.
Lyndon White,

Non è possibile applicare una rete convoluzionale ai dati non strutturati (non in sequenza / griglia, ecc.). Fondamentalmente non ha senso. Una rete convoluzionale è strettamente correlata al prendere la trasformata di Fourier del tuo input, ad esempio per le sequenze che la convertono dal dominio del tempo al dominio della frequenza.
Lyndon White,

Risposte:


8

Le caratteristiche delle immagini che le rendono suscettibili di essere classificate con una rete neurale profonda sono le caratteristiche (forse milioni se non miliardi di pixel con RGB, intensità, ecc.) E se si dispone di etichette precise, non si tratta di dati rumorosi. Le telecamere in questi giorni sono molto buone e non misurano male nulla. Grazie a Internet, ora abbiamo molte immagini accuratamente etichettate. Una rete profonda può esprimere funzioni arbitrariamente complicate, il che è un problema con i dati rumorosi perché puoi facilmente sovrautilizzare il rumore, quindi perché molti metodi di apprendimento tendono a penalizzare modelli complicati. Nel caso del riconoscimento delle immagini, tuttavia, la vera funzione sembra in realtà essere molto complicata, non abbiamo idea di come sia la forma funzionale e non sappiamo nemmeno quali siano le caratteristiche rilevanti in molti casi.

Ciò non significa che non è possibile utilizzare reti profonde per apprendere funzioni che non hanno nulla a che fare con le immagini. Devi solo stare molto attento agli aspetti negativi, soprattutto che è molto incline al sovradimensionamento, ma anche che è computazionalmente costoso e può richiedere molto tempo per allenarsi (non tanto un problema in questi giorni con SGD e GPU parallelizzate). L'altro aspetto negativo è che l'interpretazione del modello è minima o nulla, il che non ha importanza per la classificazione delle immagini. Stiamo solo cercando di far riconoscere ai computer la differenza tra uno scimpanzé e un orangutan. La comprensione umana della formula non ha importanza. Per altri settori, in particolare la diagnostica medica, la ricerca sulle politiche, ecc., Desideri o potresti anche aver bisogno della comprensione umana.


5

Sicuramente puoi usare reti neurali profonde per molti problemi oltre al riconoscimento delle immagini o del parlato. Il problema è se ne hai davvero bisogno.

Le reti neurali profonde sono molto più potenti di una semplice MLP, ma richiedono anche più risorse e sono più difficili da sviluppare. Quindi vengono utilizzati in domini molto complessi. Potresti usarli per risolvere problemi più facili, ma di solito anche i modelli più semplici ottengono buoni risultati.

Usare reti neurali profonde per problemi facili sarà come uccidere le mosche con un bazooka, sicuro che le ucciderai ma non riesci a trovare un modo più semplice?


2
Questa è una non risposta. Cosa è facile, cosa è difficile? Prevedere il mercato azionario / estrapolare da esempi limitati / ... CI SONO molti problemi difficili che sono profondi in tutti i settori?
seanv507,

Non ho detto che le reti neurali profonde possano risolvere qualsiasi cosa. Quello che volevo dire è che sono utilizzati in domini complessi in cui hai un numero enorme di voci. So che non possono risolvere tutti i problemi, ma non è questo il punto di questa domanda. Il punto sta enfatizzando il fatto che potrebbero essere applicati ad altri problemi oltre al riconoscimento di immagini / parole, ma hanno aspetti negativi che vale la pena considerare nei casi in cui altri modelli potrebbero essere applicati.
davidivad,

5

Sono d'accordo con la risposta di David. Ma penso anche che l'applicazione di reti neurali profonde alle immagini sia quella (e, cosa più importante, etichettata immagini ) sono relativamente poco costose da collezionare. In altri domini, può essere molto costoso raccogliere dati su larga scala, specialmente nei limiti di una tipica impresa industriale o governativa. A complicare questo problema è che in molte applicazioni il fenomeno di interesse è relativamente raro, quindi ci saranno pochi esempi preziosi da cui imparare, quindi anche uno sforzo di raccolta dati su larga scala potrebbe produrre un piccolo numero di membri di una classe.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.