Sto lavorando su una rete di convoluzione per il riconoscimento delle immagini e mi chiedevo se potevo inserire immagini di dimensioni diverse (non enormemente diverse).
Su questo progetto: https://github.com/harvardnlp/im2markup
Dicono:
and group images of similar sizes to facilitate batching
Quindi, anche dopo la preelaborazione, le immagini sono ancora di dimensioni diverse, il che ha senso poiché non ritagliano una parte della formula.
Ci sono problemi nell'uso di dimensioni diverse? In caso affermativo, come dovrei affrontare questo problema (poiché le formule non si adattano tutte alla stessa dimensione dell'immagine)?
Qualsiasi input sarà molto apprezzato