Tensorflow 文本摘要设置:什么是工作区文件?

Tensorflow text summarization setup : What is a workspace file?

阅读 Tensorflow 文本摘要文档设置:https://github.com/tensorflow/models/tree/master/textsum 它指出 clone the code to your workspace and create empty WORKSPACE file.

我创建了一个新文件夹并将 https://github.com/tensorflow/tensorflow.git 克隆到此文件夹,'clone the code to your workspace' 是什么意思?什么是空工作区文件?它是一个名为 'WORKSPACE' 的空文件吗?

WORKSPACE 是 bazel(tensorflow 的构建系统)在目录层次结构中搜索以确定项目的 root 的文件。

您可以创建一个简单的空 WORKSPACE 文件。

$touch WORKSPACE

在我的设置中,我刚刚创建了另一个目录

cd models
mkdir traintextsum
cd traintextsum
ln -sf ../textsum/ .
mkdir data 
touch WORKSPACE
bazel build -c opt --config=cuda textsum/...

请记住,模型未经训练。因此,要产生任何有意义的结果,您必须拥有一些具有 Gigaword Dataset Format 的数据集来对其进行训练。

数据集有许可证,因此不能在线免费获得(一年订阅费用约为 6000 美元或 27000 美元)。

除了 Gigaword 本身,我不知道有任何其他有意义的数据集具有这种格式。