如何从列表构建 TensorFlow 数据集
How do I build a TensorFlow dataset from a list
我不是工程师,在遵循有关如何构建数据集的 TF 文档时遇到了麻烦。
我收集了一个带有标签的句子数据集,我想将其转换为类似于 IMDB 数据集的 TF 数据集。
名单是这样的:
LIST=[('text1',0),('text2',1),('text3',1),('text4',0),...]
列表中有 ~100 000 个元素,以及 2 个可能的标签 0-1。
我的任务是构建一个模型,将给定句子与单个标签 0-1 配对,就像 IMDB 评论的基本 TF 示例一样。
我想我不需要任何其他东西来构建数据集。我错了吗?
如何将此列表转换为 TF 数据集?
如有任何指导,我将不胜感激
工作示例代码
import tensorflow as tf
LIST=[('text1',0),('text2',1),('text3',1),('text4',0)]
text = [x[0] for x in LIST]
label = [x[1] for x in LIST]
dataset = tf.data.Dataset.from_tensor_slices(text)
for element in dataset:
print(element)
输出:
tf.Tensor(b'text1', shape=(), dtype=string)
tf.Tensor(b'text2', shape=(), dtype=string)
tf.Tensor(b'text3', shape=(), dtype=string)
tf.Tensor(b'text4', shape=(), dtype=string)
我不是工程师,在遵循有关如何构建数据集的 TF 文档时遇到了麻烦。
我收集了一个带有标签的句子数据集,我想将其转换为类似于 IMDB 数据集的 TF 数据集。
名单是这样的:
LIST=[('text1',0),('text2',1),('text3',1),('text4',0),...]
列表中有 ~100 000 个元素,以及 2 个可能的标签 0-1。
我的任务是构建一个模型,将给定句子与单个标签 0-1 配对,就像 IMDB 评论的基本 TF 示例一样。
我想我不需要任何其他东西来构建数据集。我错了吗?
如何将此列表转换为 TF 数据集?
如有任何指导,我将不胜感激
工作示例代码
import tensorflow as tf
LIST=[('text1',0),('text2',1),('text3',1),('text4',0)]
text = [x[0] for x in LIST]
label = [x[1] for x in LIST]
dataset = tf.data.Dataset.from_tensor_slices(text)
for element in dataset:
print(element)
输出:
tf.Tensor(b'text1', shape=(), dtype=string)
tf.Tensor(b'text2', shape=(), dtype=string)
tf.Tensor(b'text3', shape=(), dtype=string)
tf.Tensor(b'text4', shape=(), dtype=string)