Da quanto ho capito, le CNN sono composte da due parti. La prima parte (livelli conv / pool) che esegue l'estrazione delle caratteristiche e la seconda parte (livelli fc) che esegue la classificazione delle caratteristiche.
Dato che le reti neurali completamente connesse non sono i migliori classificatori (ovvero sono sovraperformate dalle SVM e dalle RF per la maggior parte del tempo), perché le CNN si concludono con gli strati FC, piuttosto che con una SVM o una RF?