La classificazione delle immagini è il compito di assegnare uno deietichette precedentemente note per una determinata immagine. Ad esempio, sai che ti verranno fornite un paio di foto e ogni singola immagine ne ha esattamente unadentro. L'algoritmo dovrebbe dire cosa mostra la foto.
Il set di dati di riferimento per la classificazione delle immagini è ImageNet ; in particolare la tua sfida al riconoscimento visivo su larga scala (LSVRC) . Ha esattamente 1000 classi e un'enorme quantità di dati di allenamento (penso che esista una versione sotto campionata con immagini di circa 250 x 250 pixel, ma molte immagini sembrano provenire da Flicker).
Questa sfida è in genere risolta con CNN (o altre reti neurali).
Esiste un documento che tenta un approccio che non utilizza reti neurali in LSVRC?
Per chiarire la domanda: ovviamente, ci sono altri algoritmi di classificazione come vicini o SVM più vicini. Tuttavia, dubito che funzionino affatto per così tante classi / così tanti dati. Almeno per-NNs sono sicuro che la previsione sarebbe estremamente lenta; per gli SVM suppongo che sia l'adattamento che la previsione sarebbero molto lenti (?).