Ho l' architettura di rete del documento "apprendere la somiglianza dell'immagine a grana fine con una classifica profonda" e non sono in grado di capire come l'output della rete a tre parallele viene unito utilizzando il livello di incorporamento lineare. Le uniche informazioni fornite su questo livello, nel documento sono
Infine, normalizziamo le decorazioni dalle tre parti e le combiniamo con uno strato di inclinazione lineare. La dimensione dell'incorporamento è 4096.
Qualcuno può aiutarmi a capire cosa intende esattamente l'autore quando parla di questo livello?