L'idea con Neural Networks è che hanno bisogno di poca pre-elaborazione poiché il sollevamento pesante viene eseguito dall'algoritmo che è responsabile dell'apprendimento delle funzionalità.
I vincitori del Data Science Bowl 2015 hanno un ottimo resoconto sul loro approccio, quindi la maggior parte del contenuto di questa risposta è stata presa da:
Classificazione del plancton con reti neurali profonde . Ti suggerisco di leggerlo, in particolare la parte relativa alla pre-elaborazione e all'aumento dei dati .
- Ridimensiona le immagini
Per quanto riguarda dimensioni, risoluzioni o distanze diverse, puoi procedere come segue. Puoi semplicemente ridimensionare il lato più grande di ogni immagine a una lunghezza fissa.
Un'altra opzione è usare openCV o scipy. e questo ridimensionerà l'immagine per avere 100 cols (larghezza) e 50 righe (altezza):
resized_image = cv2.resize(image, (100, 50))
Un'altra opzione è quella di utilizzare il modulo scipy, usando:
small = scipy.misc.imresize(image, 0.5)
- Aumento dei dati
L'aumento dei dati migliora sempre le prestazioni sebbene l'importo dipenda dal set di dati. Se si desidera aumentare i dati per aumentare artificialmente la dimensione del set di dati, è possibile effettuare le seguenti operazioni se il caso si applica (non si applicherebbe se, ad esempio, fossero immagini di case o persone in cui se le ruotassi di 180 gradi, perderebbero tutte le informazioni ma non se li capovolgi come fa uno specchio):
- rotazione: casuale con angolo compreso tra 0 ° e 360 ° (uniforme)
- traduzione: casuale con spostamento tra -10 e 10 pixel (uniforme)
- riscalamento: casuale con fattore di scala compreso tra 1 / 1.6 e 1.6 (log-uniform)
- lanciando: sì o no (bernoulli)
- taglio: casuale con angolo compreso tra -20 ° e 20 ° (uniforme)
- allungamento: casuale con fattore di allungamento compreso tra 1 / 1.3 e 1.3 (log-uniform)
Puoi vedere i risultati sulle immagini della ciotola di Data Science.
Immagini preelaborate
versioni aumentate delle stesse immagini
-Altre tecniche
Queste si occuperanno di altre proprietà dell'immagine come l'illuminazione e sono già correlate all'algoritmo principale più come una semplice fase di pre-elaborazione. Controlla l'elenco completo su: Tutorial UFLDL