IBM Cloud Watson Discovery:相关性训练从未成功运行

IBM Cloud Watson Discovery: Relevancy training never runs successfully

我将包含 9 个文档的 CSV 文件上传到 Watson Discovery 中的一个集合。我已经尝试用一些查询来搜索这个集合,但尽管返回了正确的文档,但置信度确实很低(0.01 -> 0.02)。这让我接受了 Relevancy 培训。我输入了大约 60 个问题并对返回的结果进行评分(在改进工具面板上)。但是,在我看来,培训永远不会开始。 IBM 不断显示“IBM 将很快开始学习”。 这是 python-sdk API 检查的项目状态。几天来都是这样。

我的问题是:

  1. 导致训练过程不是 运行 的相关训练可能有什么问题?
  2. 对于未经训练的集合(未经训练的策略),0.01 -> 0.02 的置信度是否正常?

提前致谢。

原来是文件格式不对。我的同事上传了一个包含 HTML 代码的 CSV 文件,但 IBM Discovery 似乎不喜欢它。

我将它们转换为一组 pdf 文件并且有效。