Ho studiato l'architettura della rete neurale siamese introdotta da Yann LeCun e dai suoi colleghi nel 1994 per il riconoscimento delle firme ( "Verifica della firma usando una rete neurale siamese di ritardo" .pdf , NIPS 1994)
Ho capito l'idea generale di questa architettura, ma non riesco davvero a capire come funziona la backpropagation in questo caso. Non riesco a capire quali sono i valori target della rete neurale, che consentiranno alla backpropagation di impostare correttamente i pesi di ciascun neurone.
In questa architettura, l'algoritmo calcola la somiglianza del coseno tra le rappresentazioni finali delle due reti neurali Il documento afferma: "L'output desiderato è per un piccolo angolo tra gli output delle due sottoreti (f1 e f2) quando vengono presentate le firme autentiche e un grande angolo se una delle firme è un falso ".
Non riesco davvero a capire come potrebbero usare una funzione binaria (somiglianza del coseno tra due vettori) come obiettivo per eseguire la backpropagation.
Come viene calcolata la backpropagation nelle reti neurali siamesi?