如何使用 Watson NLC Toolkit 管理多个训练集

How do I manage multiple training sets using the Watson NLC Toolkit

据我所知,无法将多个训练集上传到新的 Watson NLC 工具。我需要管理单独的训练集及其关联的分类器。我在这里错过了什么?

首选选项:为您要使用的每组训练数据提供一个 NLC 服务实例,并分别访问每个实例的工具。

解决方法:目前在一个NLC服务实例中管理多个训练集的流程如下:

  1. (可选择重新开始)转到训练数据页面并单击垃圾图标以删除所有训练数据。
  2. 使用上传图标在训练数据页面上上传训练集。
  3. 根据需要处理数据。添加文本和 类,用 类 标记文本等
  4. 创建分类器。当您创建分类器时,它实际上是您当前训练数据的快照,因为您稍后可以从分类器页面检索它。

根据需要重复步骤 1-4,直到您上传了所有训练数据集并创建了相应的分类器。

当您想继续处理之前的训练集时:

  1. 清除训练数据(上述第 1 步)。
  2. 转到分类器页面。
  3. 单击包含您要使用的训练数据的分类器的下载图标。
  4. Return到训练数据页面,上传第3步下载的文件

管理多个训练集的最佳方式是为每个训练集使用不同的 NLC 服务实例。

当前的测试版 NLC 工具并非旨在管理单个服务实例中的单独训练集。例如,当您添加没有 类 的文本时,该工具会提出建议 - 这些建议基于最近训练的分类器,如果它基于完全不同的训练集,则没有意义。

如果您出于某种原因对可以使用的 NLC 服务数量有硬性限制(例如,您已达到 Bluemix 服务的限制。成本不是这里的一个因素,因为额外的 NLC 服务实例不会增加整体价格,因为月费是针对训练有素的分类器实例。例如,如果您有四个服务实例,每个实例中有一个分类器,您将看到 3 个收费和 1 个免费。

如果您想使用 NLC 测试版工具来管理您的训练数据,我建议您为您需要的每个训练集使用单独的 NLC 服务。