Immagini non quadrate per la classificazione delle immagini


9

Ho un set di dati di immagini di grandi dimensioni: 1760x128. Ho letto tutorial e libri, e la maggior parte di essi afferma che le immagini di input devono essere quadrate e, in caso contrario, vengono trasformate in quadrate per essere addestrate in CNN già formati (su immagini quadrate). C'è un modo per addestrare cnn per immagini non quadrate o dovrei cercare un'altra opzione come riempimento?

Risposte:


4

Esistono diversi modi per risolvere il problema a seconda del classificatore. Lo scorrimento di Windows è il metodo con cui ho più familiarità, questo è usato per i metodi di rete neurale. Questo metodo prevede l'acquisizione di una piccola immagine secondaria e lo spostamento su e giù con alcune sovrapposizioni. Alcuni problemi includono la ricerca dei parametri di spostamento ottimali e problemi multi-scala.

Il rilevamento finale è di solito determinato dalla fiducia del classificatore nel fatto che ciascuna delle sottoimmagini appartengono a quella classe: ad esempio il voto di maggioranza, la probabilità totale o la distanza totale dal confine della decisione. Di seguito ho elencato del materiale, il primo è per il metodo di classificazione HOG ma i concetti sono gli stessi.

  1. Rilevamento oggetti Windows scorrevole
  2. Rilevamento categoria di oggetti: finestre scorrevoli
  3. Riconoscimento, localizzazione e rilevamento integrati di OverFeat tramite reti convoluzionali

2

Ciò non dovrebbe causare alcun problema se si utilizza una CNN. Ho creato una CNN per riconoscere i volti e, dato che i volti sono generalmente larghi di circa il 70% quanto alti, ho usato immagini di allenamento di 80x100 pixel (una larghezza extra nel caso in cui la testa fosse inclinata). I filtri dovrebbero comunque essere quadrati.

Tutto ciò che cambierebbe sarebbe che ora devi tenere traccia di una larghezza e un'altezza per le tue mappe di attivazione / pool invece di un solo valore che ti dice la dimensione. Per esempio -

Immagine di input di 80 x 100 Applica 5 x 5 filtro di convoluzione fornisce una mappa di attivazioni a 76 x 96 Applica 2 x 2 pool fornisce una mappa di attivazioni in pool a 38 x 48

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.