如何在 tensorflow2 中制作这样的数据集:<PrefetchDataset shapes: ((), ()), types: (tf.string, tf.string)>

how to make dataset like this in tensorflow2: <PrefetchDataset shapes: ((), ()), types: (tf.string, tf.string)>

我想在进行 NLP 翻译时制作自己的数据集。例如, x = ["这是一个苹果"] y = [“这是一个梨”]。 如何显示我制作的数据集可以适合“

”.

您需要做的就是创建一个 tf.data.Dataset with these two tensors as argument to the from_tensor_slices 静态方法。

import tensorflow as tf

x = ["It is an apple"]
y = ["It is a pear"]

xy = tf.data.Dataset.from_tensor_slices((x, y))
print(xy)
>>> <TensorSliceDataset shapes: ((), ()), types: (tf.string, tf.string)>

这对应于您要查找的数据集签名。您可以使用 prefetch 方法创建预取数据集:

dataset = xy.prefetch(1)
print(dataset)
>>> <PrefetchDataset shapes: ((), ()), types: (tf.string, tf.string)>