如何从列表构建 TensorFlow 数据集

How do I build a TensorFlow dataset from a list

我不是工程师,在遵循有关如何构建数据集的 TF 文档时遇到了麻烦。

我收集了一个带有标签的句子数据集,我想将其转换为类似于 IMDB 数据集的 TF 数据集。

名单是这样的:

LIST=[('text1',0),('text2',1),('text3',1),('text4',0),...]

列表中有 ~100 000 个元素,以及 2 个可能的标签 0-1。

我的任务是构建一个模型,将给定句子与单个标签 0-1 配对,就像 IMDB 评论的基本 TF 示例一样。

我想我不需要任何其他东西来构建数据集。我错了吗?

如何将此列表转换为 TF 数据集?

如有任何指导,我将不胜感激

工作示例代码

import tensorflow as tf

LIST=[('text1',0),('text2',1),('text3',1),('text4',0)]
text = [x[0] for x in LIST]
label = [x[1] for x in LIST]
dataset = tf.data.Dataset.from_tensor_slices(text)
for element in dataset:
  print(element)

输出:

tf.Tensor(b'text1', shape=(), dtype=string)
tf.Tensor(b'text2', shape=(), dtype=string)
tf.Tensor(b'text3', shape=(), dtype=string)
tf.Tensor(b'text4', shape=(), dtype=string)