Sto cercando di rilevare il logo di un canale TV all'interno di un file video, quindi semplicemente dato un .mp4
video di input , rilevare se ha quel logo presente in un frame specifico, dire il primo frame o no.
Abbiamo quel logo in anticipo (anche se potrebbe non essere la stessa dimensione% 100) e la posizione è sempre fissa.
Ho già un approccio basato sul pattern matching. Ma ciò richiede che il modello sia% 100 della stessa dimensione. Vorrei utilizzare Deep Learning e Neural Network per raggiungere questo obiettivo. Come lo posso fare? Credo che la CNN possa avere una maggiore efficienza?