Tensorflow 数据集性能?

Tensorflow Dataset performances?

我正在实施一个受 NMT model. I am using a training set stored as TFRecords files, using a TFRecordDataset to fetch it and feed the model. Following Google's recommendations 关于输入管道性能改进的启发的模型,我有:

然而,GPU 仍保持在最大 40%,几乎没有 运行 在 CPU 上慢。因此,我想知道 prefetch 操作。

如有关于数据集加速的任何其他建议,我们将不胜感激。

显然,数据集 API 在 CPU and not on GPU 上运行,所以这回答了问题。