Algoritmi di visione artificiale (come è possibile?)


9

Di recente mi sono imbattuto in una società che ha creato quella che sembra essere una tecnologia di visione artificiale in grado di rilevare automaticamente il taccheggio e avvisare i suoi utenti.

LINK

Guardare alcuni dei video e degli esempi forniti dalla compagnia mi ha lasciato completamente sconcertato e stupito di come avrebbero potuto ottenere questa funzionalità.

Capisco che nessuno qui sarà in grado di dirmi esattamente come questo potrebbe essere stato raggiunto, ma qualcuno è a conoscenza - e potrebbe indicarmi - la ricerca in questo campo o in alternativa forse fornire dettagli su come qualcosa di simile potrebbe essere implementato o guida su dove si potrebbe iniziare?

La mia comprensione era che gli algoritmi di visione artificiale erano lontani molti anni dall'essere così sofisticati. Questo tipo di applicazione è davvero possibile? Qualcuno disposto a rischiare un'ipotesi su come hanno raggiunto questo obiettivo?


2
Questo non sembra così difficile. I giochi rilevano continuamente collisioni tra oggetti; perché non riuscivi a rilevare le collisioni tra una persona e uno scaffale di oggetti e quindi a dare l'allarme quando quella persona camminava verso la porta senza pagare?
Robert Harvey,

Esattamente. È solo il riconoscimento degli oggetti e il rilevamento delle collisioni. A meno che non lo aggancino allo scanner, è facilmente possibile spostare gli oggetti sullo scanner, ma appena sopra di esso. L'oggetto sembrerà essere entrato in collisione con lo scanner, ma in realtà no.
Andrew T Finnell,

Ad ogni modo, nessuno dei meccanismi di rilevamento descritti nel sito Web (amorevole, perdita del paniere e controllo automatico) richiede qualcosa di così sofisticato da remoto. Eseguono il check-in in un'area molto ristretta (il contatore della cassa) e possono eseguire un controllo incrociato degli oggetti visti nel carrello rispetto a ciò che lo scanner di codici a barre sta dicendo è stato effettivamente scansionato.
Robert Harvey,

1
Mi dispiace, sono confuso. Facciamo l'esempio del tesoro. Ho due articoli, uno a basso costo, uno alto. Metto l'articolo a basso costo in quello a basso costo e scansiona. A quel punto possiamo confrontare ciò che è stato scansionato nel sistema POS con ciò che è visibile sulla fotocamera nella mano della cassiera, ma ciò richiede che il sistema sia in grado di "capire cosa viene messo nella borsa" con centinaia di migliaia di potenziali articoli attraverso una fotocamera di qualità marginale. Questo sembra estremamente complicato. Cosa mi sto perdendo?
Maxim Gershkovich,

6
Penso che stai assumendo troppo su quanto bene funziona. Scommetto che c'è un discreto tasso di errore, ed è probabilmente molto facile giocare al sistema. Vedo questo come più di un sistema di tipo fischietto, in cui identifica solo i potenziali luoghi nel video che richiedono una revisione umana. Pertanto, l'imprecisione è ben tollerata.
chris,

Risposte:


5

Sei disinformato sullo stato dell'arte. Diversi anni fa ho lavorato per un'azienda che ha realizzato tali sistemi per vari scopi. Uno era un sistema di controllo dell'uscita aeroportuale di grande successo, che poteva facilmente distinguere la differenza tra una persona che camminava nel corridoio sbagliato e cose come palle in movimento o persone che si dirigevano nella direzione giusta. Riconoscere gli oggetti in una scena in tempo reale non è facile, ma lo facevamo su CPU integrate, non su supercomputer.

Non ho visto nulla che non fosse credibile qualche anno fa.


4

In realtà questa azienda utilizza un ibrido di visione artificiale e revisione manuale in India. Non è pura visione artificiale soprattutto per elementi come l'amore. In effetti conosco un rivenditore che ha un bel problema con questo sistema non a causa delle prestazioni del sistema che conservo ma del video di spedizione della larghezza di banda in India. Questa codifica manuale è il modo in cui riducono gli errori ed è una tipica indagine tecnologica con alcuni fornitori ora.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.