Sto cercando di fare l' tensorflow
equivalente di torch.transforms.Resize(TRAIN_IMAGE_SIZE)
, a cui ridimensiona la dimensione dell'immagine più piccolaTRAIN_IMAGE_SIZE
. Qualcosa come questo
def transforms(filename):
parts = tf.strings.split(filename, '/')
label = parts[-2]
image = tf.io.read_file(filename)
image = tf.image.decode_jpeg(image)
image = tf.image.convert_image_dtype(image, tf.float32)
# this doesn't work with Dataset.map() because image.shape=(None,None,3) from Dataset.map()
image = largest_sq_crop(image)
image = tf.image.resize(image, (256,256))
return image, label
list_ds = tf.data.Dataset.list_files('{}/*/*'.format(DATASET_PATH))
images_ds = list_ds.map(transforms).batch(4)
La semplice risposta è qui: Tensorflow: ritaglia la più grande regione quadrata centrale dell'immagine
Ma quando uso il metodo con tf.data.Dataset.map(transforms)
, ottengo shape=(None,None,3)
dall'interno largest_sq_crop(image)
. Il metodo funziona bene quando lo chiamo normalmente.
largest_sq_crop
?
EagerTensors
non sono disponibili all'interno,Dataset.map()
quindi la forma è sconosciuta. c'è una soluzione?