LUIS - 两个聊天机器人意图的相似训练话语

LUIS - Similar training utterances for two chatbot intents

前提: 我正在使用 ML Luis framework 开发聊天机器人。这基本上是一个黑盒框架,我不知道如何以正确的方式调整它来解决这个问题。

我的聊天机器人有两个 intents/classes。为简单起见,说:

是上述两个意图。在我的训练集中,我有两个 classes:

喜欢 class:

I like it

I like cats

I really like mouses

不喜欢 class:

I don't like it

I don't like dolphins

I really don't like dogs

这两个 class 的训练集短语非常相似,当我尝试对属于这两个 class 之一的短语进行一些预测时,分数真的很关闭,例如:

 I like armadillos -> 0.86 like | 0.8 don't like

基本上,这两个 domains/classes 有很大的重叠,只有一个词不同(不要,如示例所示)。有没有一种方法可以有效地训练模型(使用 Luis1)来增加相似话语之间的分数差异?

LUIS主要用到一个conditional random field (CRF) to extract entities (see here)。由于在 CRF 中概率是根据单词序列计算的,因此在您的情况下您不能更改 LUIS 中的任何因素。因为两种情况下的单词序列非常相似。

要解决这个问题,您可以在 LUIS 之外做一些处理,或者为 LUIS 准备更多的话语来识别差异。但是,后一种解决方案可能没有我在第一段中解释的那么多。