Una linea (chiara) tra Computer Vision ed elaborazione delle immagini


14

Lavoro e apprendo sia sulla visione del computer che sull'elaborazione delle immagini da qualche anno e credo di non essere più un principiante assoluto.

Tuttavia, dopo tutti questi anni, per me è difficile dire per ogni particolare parte del mio lavoro se si tratta principalmente di visione artificiale o se si tratta di elaborazione di immagini . Non riesco proprio a vedere la linea - quando lavoro, studio e ricerca, leggo materiali di riferimento con entrambe le parole chiave.

Quindi, sono interessato alla definizione dei campi di visione artificiale e di elaborazione delle immagini, con particolare attenzione al confronto (differenze e sovrapposizioni) dei campi .

Inoltre, penso che sarebbe utile avere un esempio di applicazioni (concettuali o esistenti) pratiche, progetti e opere che trattano / utilizzano:

  • esclusivamente (o principalmente) strumenti e idee per la visione del computer
  • esclusivamente (o principalmente) strumenti e idee per l'elaborazione delle immagini
  • una combinazione di strumenti e idee provenienti da entrambi i campi

con particolare attenzione a ciò che lo rende uno e non l'altro , o ciò che lo rende entrambi .

Comprendo che questi campi sono altamente correlati e che la "linea" potrebbe non essere chiara come questa domanda, ma spero che tu capisca che il punto di questa domanda non era progettare una semplice regola decisionale per la classificazione (mia) lavoro, ma piuttosto una migliore comprensione del focus e degli obiettivi di questi campi. Inoltre, qualsiasi informazione aggiuntiva che sembri in argomento con il mio tono di domanda è benvenuta, anche se non l'ho specificatamente richiesta.


Che dire di "Visione artificiale"? Lo pensi come sinonimo di "Computer Vision"?
Alessandro Jacopson,

@uvts_cvs Ad essere sincero, non ho mai insegnato "Machine Vision" ... forse questo potrebbe avere un significato di "Macchine (con sistemi embedded) specializzati per preformare alcuni compiti di Computer Vision", ad esempio ho letto una volta delle telecamere in grado di riconoscere la licenza piatti. Ma di nuovo, potrei sbagliarmi su questo :)
penelope,

Risposte:


12

Credo che Gonzalez e Woods siano abbastanza competenti da fare affidamento sulla loro opinione:

Non esiste un accordo generale tra gli autori in merito a dove si interrompe l'elaborazione delle immagini e ad altre aree correlate, come l'analisi delle immagini e la visione al computer. A volte viene fatta una distinzione definendo l' elaborazione delle immagini come una disciplina in cui sia l'input che l'output di un processo sono immagini. Riteniamo che questo sia un limite limitante e in qualche modo artificiale . Ad esempio, in base a questa definizione, anche il banale compito di calcolare l'intensità media di un'immagine (che produce un singolo numero) non sarebbe considerato un'operazione di elaborazione delle immagini. D'altra parte, ci sono campi come la visione artificiale il cui obiettivo finale è quello di utilizzare i computer per emulare la visione umana, incluso l'apprendimento e la capacità di fare inferenze e intraprendere azioni basate su input visivi. Questa stessa area è un ramo dell'intelligenza artificiale (AI) il cui obiettivo è emulare l'intelligenza umana. Il campo dell'IA è nelle sue prime fasi dell'infanzia in termini di sviluppo, con progressi che sono stati molto più lenti di quanto inizialmente previsto. L'area dell'analisi delle immagini (chiamata anche comprensione delle immagini) è tra l'elaborazione delle immagini e la visione computerizzata .

Quindi direi che la differenza principale sta negli obiettivi, non nei metodi. Ad esempio, se l'obiettivo è migliorare l'immagine per un uso successivo da parte dell'uomo, questo potrebbe essere chiamato elaborazione dell'immagine. E se l'obiettivo è emulare la visione umana (che si tratti di riconoscimento di oggetti, rilevamento di difetti o guida automatica), allora è più vicino alla visione del computer. Si noti, tuttavia, che emulare la visione umana per definizione può anche richiedere un miglioramento dell'immagine, quindi nella maggior parte dei casi reali la visione computerizzata si basa sull'elaborazione dell'immagine .

La comprensione delle immagini (estrazione delle caratteristiche) può essere utilizzata in egual modo sia nella pura elaborazione delle immagini che nella visione artificiale.


Aspetti positivi ..
Spacey,

risposta molto bella. solo il rapporto perfetto tra materiale di riferimento e interpretazione per esperienza. grazie
penelope il

10

Per come la capisco, l'obiettivo dell'elaborazione delle immagini è ottenere un'immagine (in qualche modo trasformata). L'obiettivo della visione artificiale è quello di scoprire qualcosa sulle cose nella dell'immagine (come è il ragazzo sulla felice o triste immagine, quante auto ci sono a immagine e da che parte stanno guidando).

esclusivamente (o principalmente) strumenti e idee per la visione del computer

Non penso sia possibile, non il modo in cui capisco i termini.

esclusivamente (o principalmente) strumenti e idee per l'elaborazione delle immagini

Prendiamo ad esempio Adobe Photoshop: può acquisire un'immagine e trasformarla in un'immagine di una persona più snella con una pelle migliore. Ma non "conosce" nulla degli oggetti raffigurati nell'immagine.


Lasciate che vi faccia un esempio: attualmente sto lavorando al recupero di immagini in base al contenuto. Molte persone insistono sul fatto che l'elaborazione delle immagini. Non sono sicuro che si adatti alla tua risposta (non dire che è una cattiva risposta, mi chiedo solo)
penelope

Un indicatore è: il risultato del tuo compito è un'immagine (IP) o qualche altra struttura di dati (CV). In CBIR, il risultato è un'altra struttura di dati (ad esempio una misura di somiglianza tra le immagini), quindi direi che è una visione computerizzata. Wikipedia dice che è anche una visione artificiale.
Niki Estner,

Lì, ho fatto un po 'di ricerche su me stesso ora e ho trovato questo articolo di panoramica e cito: "In questi sistemi, gli algoritmi di elaborazione delle immagini (di solito automatici) vengono utilizzati per estrarre i vettori di funzionalità che rappresentano le proprietà delle immagini come il colore, consistenza e forma ". L'articolo mi sembra abbastanza solido ...
penelope,

2
Sì, ogni sistema di visione artificiale utilizza algoritmi di elaborazione delle immagini.
Niki Estner,

Non sono in disaccordo con nessun punto particolare nella tua risposta e / o spiegazioni ... Semplicemente non ... si adatta perfettamente come vorrei immagino. Ma questo si sta trasformando in una discussione, ed è controproducente. Quindi, spero solo che ci saranno altri contributi alla domanda che si spera possano dare una prospettiva diversa / più chiara;)
penelope,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.