LUIS - 两个聊天机器人意图的相似训练话语

Question

前提： 我正在使用 ML Luis framework 开发聊天机器人。这基本上是一个黑盒框架，我不知道如何以正确的方式调整它来解决这个问题。

我的聊天机器人有两个 intents/classes。为简单起见，说：

是上述两个意图。在我的训练集中，我有两个 classes:

喜欢 class:

I like it

I like cats

I really like mouses

不喜欢 class:

I don't like it

I don't like dolphins

I really don't like dogs

这两个 class 的训练集短语非常相似，当我尝试对属于这两个 class 之一的短语进行一些预测时，分数真的很关闭，例如：

 I like armadillos -> 0.86 like | 0.8 don't like

基本上，这两个 domains/classes 有很大的重叠，只有一个词不同（不要，如示例所示）。有没有一种方法可以有效地训练模型（使用 Luis1）来增加相似话语之间的分数差异？

Answer 1

LUIS主要用到一个conditional random field (CRF) to extract entities (see here)。由于在 CRF 中概率是根据单词序列计算的，因此在您的情况下您不能更改 LUIS 中的任何因素。因为两种情况下的单词序列非常相似。

要解决这个问题，您可以在 LUIS 之外做一些处理，或者为 LUIS 准备更多的话语来识别差异。但是，后一种解决方案可能没有我在第一段中解释的那么多。

LUIS - Similar training utterances for two chatbot intents