Quali sono le caratteristiche del collo di bottiglia?


11

Nel post del blog Creazione di potenti modelli di classificazione delle immagini utilizzando pochissimi dati , vengono menzionate le funzionalità del collo di bottiglia. Quali sono le caratteristiche del collo di bottiglia? Cambiano con l'architettura utilizzata? Sono l'output finale degli strati convoluzionali prima dello strato completamente connesso? Perché si chiamano così?


Risposte:


9

Nel post del blog Creazione di potenti modelli di classificazione delle immagini utilizzando pochissimi dati , vengono menzionate le funzionalità del collo di bottiglia. Quali sono le caratteristiche del collo di bottiglia?

È chiaramente scritto nel link che hai dato alle "caratteristiche del collo di bottiglia" del modello VGG16: le ultime mappe di attivazione prima dei livelli completamente connessi .

Cambiano con l'architettura utilizzata?

Sicuro. L'autore molto probabilmente ha usato un modello pre-addestrato (addestrato su dati di grandi dimensioni e ora usato solo come estrattore di funzioni)

Sono l'output finale degli strati convoluzionali prima dello strato completamente connesso?

Sì.

Perché si chiamano così?

Date le dimensioni di input a VGG, le mappe delle caratteristiche delle dimensioni HxW stanno diventando due volte più piccole dopo ogni operazione di max pool. HxW è il più piccolo sull'ultimo livello convoluzionale.


6

Innanzitutto, dobbiamo parlare dell'apprendimento del trasferimento. Immagina di aver addestrato una rete neuronale su un set di dati di immagini per rilevare i gatti, puoi usare parte dell'allenamento che hai fatto per lavorare su un altro che rileva qualcos'altro. Questo è noto come apprendimento del trasferimento.

Per eseguire l'apprendimento di trasferimento, rimuoverai l'ultimo livello completamente connesso dal modello e collegherai i tuoi livelli lì. L'output del modello "troncato" sarà le caratteristiche che riempiranno il tuo "modello". Queste sono le caratteristiche del collo di bottiglia.

VGG16 è un modello preinstallato sul catalogo ImageNet con una precisione molto buona. Nel post che hai condiviso, utilizza quel modello come base per rilevare cani e gatti con una maggiore precisione.

Le caratteristiche del collo di bottiglia dipendono dal modello. In questo caso, stiamo usando VGG16. Esistono altri modelli pre-addestrati come VGG19, ResNet-50

È come se stessi tagliando un modello e aggiungendo i tuoi livelli. Principalmente, il livello di output per decidere cosa si desidera rilevare, l'output finale.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.