如何对现有数据行使用 wit.ai?

How do I use wit.ai with existing rows of data?

我有很多现有数据想用作 wit.ai 聊天机器人的训练数据。数据存储在一个 csv 文件中,其中每一行都有一个 statement/question 和对该 statement/question 的响应。

我知道 wit.ai 要求您将意图分配给所做的评论,所以我想知道是否有一种方法可以简单地发送我拥有的数据并让聊天机器人开始自己学习意图.

谢谢!

"Teaching" Wit.Ai 并不是某些人认为的那样。

您必须为 User says 专栏创建故事。老实说,这些答复无关紧要。您无法 "teach" wit.ai 回复。回复在故事或您的代码中定义。

wit.ai 可能需要从您的数据中获取的关键字和关键短语可以使 wit.ai 的实体识别更好。

这是最简单的例子:

实体 color 是根据列出的关键字识别的。因此,如果您有大量数据作为用户输入的示例 - 您可以尝试先将其分解为 "which entities which user input should produce",然后是这些输入的关键字。

将您的数据用于 "teaching" - 会有点困难,因为它需要您在 wit.ai 中创建大量故事以涵盖可能的用户输入和实体识别。但你仍然可以这样做:

(粗略示例)

  1. 例如制作一个关于用户询问时间的故事
  2. 在用户输入中标记哪些实体应该从该输入派生:
  3. 对您的列表进行排序,您必须获得所有可能的询问时间的方式:
    • 现在几点了?
    • 你能告诉我时间吗?
    • 不知道现在几点了?
  4. 使用脚本 (Python) "shoot" 您故事中的所有这些用户输入。
  5. 完成后 - 转到了解 wit.ai 的时间并检查所有输入 correcting\adding 您定义的实体。

此过程将 "teach" 个基于关键字或其他算法的实体。

关于如何使用现有数据,这是我能想到的最好的方法。 Wit.Ai 不同于其他语言处理工具集,"teaching" 它与现有数据有点 "puzzling" :)

感谢发帖。我们知道这还不完美,但我们在几天前发布了 import/export 功能。查看 json 导出的结构,可以很容易地使用现有数据。这需要为每个 statement/question 创建一个故事和一个回应。更多信息在这里: https://wit.ai/docs/recipes#copyexportversion-my-app