短语列表中的 "The values are interchangable" 选项在 LUIS 中如何工作?
How does the "The values are interchangable" option in Phrase List work in LUIS?
我浏览了文档并尝试了解短语列表功能。虽然我很确定短语列表功能的用途,但我无法直观地理解 "interchangable" 选项的用途。
任何详尽的解释将不胜感激。
摘自文档 (here):
A phrase list may be interchangeable or non-interchangeable. An
interchangeable phrase list is for values that are synonyms, and a
non-interchangeable phrase list is intended for values that aren't
synonyms but are similar in another way.
MSDN 上也有很好的回复here:
Choose "Exchangeable" when the list of words or phases in your feature
form a class or group -- for example, months like "January",
"February", "March"; or names like "John", "Mary", "Frank". These
features are "exchangeable" in the sense that an utterance where one
word/phrase appears would be labeled similarly if the word/phrase were
exchanged with another. For example, if "show the calendar for January" has the same intent as "show the calendar for February", this
suggests choosing "exchangeable".
Choose "Not exchangeable" for words/phrases that are useful in your
domain, but which do not form a class or group. For example, the
words "calendar", "email", "show", and "send" might be relevant to
your domain, but might all be associated with different intents, like
"show my calendar" or "send an email".
If you're not sure, you can try either and see if there's any
difference in performance.
@Srichakradhar 根据您的建议,将与您在 gitter 上的问题相关的答案发布到 Whosebug 上的此处,同时造福于整个社区!:
“...关于您在短语列表中的问题,很高兴能就该功能的作用进行高层次的发言:)
@srichakradhar
因此,最终 LUIS 的目标是理解用户输入(话语)的含义,并通过计算,它 returns 向您提供对输入含义的置信度的价值。使用短语列表是提高确定用户话语含义的准确性的方法之一
——更具体地说,当向短语列表添加特征时,它可以为意图或实体的分数赋予更多权重。
使用几个示例来说明特征如何帮助确定 intent/entity 分数的高级概念,进而预测用户话语的含义:
例如,如果我想描述一款名为 class 的平板电脑,我可以用来描述它的功能可能包括屏幕、尺寸、电池、颜色等。如果一句话提到任何功能,它会将 points/weight 添加到预测话语的含义是描述平板电脑的分数。然而,最好包含在短语列表中的特征是可能是外国的、专有的或可能只是罕见的词。例如,也许我会在平板电脑的短语列表中添加“SurfacePro”、“iPad”或“Wugz”(一个虚构的平板电脑品牌)。然后,如果用户的话语包含“Wugz”,则更多 points/weight 将用于预测 Tablet 是话语的正确实体。
或者可能意图是 Book.Flight,特征包括“Book”、“Flight”、“Cairo”、“Seattle”等。话语是“Book me a flight to Cairo”,points/weight 的分数 Book.Flight 将添加“Book”、“flight”、“Cairo”的意图。
现在,关于可互换和不可互换的短语列表。
也许我有一个城市短语列表,其中包括“西雅图”、“开罗”、“L.A”等。我会确保短语列表是 不可互换的 ,因为这表明是的,“西雅图”和“开罗”在某种程度上彼此相似,但它们不是同义词——我不能互换使用它们,也不能用一个代替另一个。 (“预订飞往开罗的航班”不同于“预订飞往西雅图的航班”)
但是,如果我有一个 Coffee 短语列表,其中包含“Coffee”、“Starbucks”、“Joe”等特征,并将该列表标记为可互换,那么我指定列表中的特征是 可互换。 (“我想要一杯咖啡”和“我想要一杯乔”的意思相同)
有关短语列表的更多信息 - Phrase List features in LUIS
有关改进预测的更多信息 - Tutorial: Add phrase list to improve predictions"
我浏览了文档并尝试了解短语列表功能。虽然我很确定短语列表功能的用途,但我无法直观地理解 "interchangable" 选项的用途。
任何详尽的解释将不胜感激。
摘自文档 (here):
A phrase list may be interchangeable or non-interchangeable. An interchangeable phrase list is for values that are synonyms, and a non-interchangeable phrase list is intended for values that aren't synonyms but are similar in another way.
MSDN 上也有很好的回复here:
Choose "Exchangeable" when the list of words or phases in your feature form a class or group -- for example, months like "January", "February", "March"; or names like "John", "Mary", "Frank". These features are "exchangeable" in the sense that an utterance where one word/phrase appears would be labeled similarly if the word/phrase were exchanged with another. For example, if "show the calendar for January" has the same intent as "show the calendar for February", this suggests choosing "exchangeable".
Choose "Not exchangeable" for words/phrases that are useful in your domain, but which do not form a class or group. For example, the words "calendar", "email", "show", and "send" might be relevant to your domain, but might all be associated with different intents, like "show my calendar" or "send an email".
If you're not sure, you can try either and see if there's any difference in performance.
@Srichakradhar 根据您的建议,将与您在 gitter 上的问题相关的答案发布到 Whosebug 上的此处,同时造福于整个社区!:
“...关于您在短语列表中的问题,很高兴能就该功能的作用进行高层次的发言:)
@srichakradhar 因此,最终 LUIS 的目标是理解用户输入(话语)的含义,并通过计算,它 returns 向您提供对输入含义的置信度的价值。使用短语列表是提高确定用户话语含义的准确性的方法之一 ——更具体地说,当向短语列表添加特征时,它可以为意图或实体的分数赋予更多权重。
使用几个示例来说明特征如何帮助确定 intent/entity 分数的高级概念,进而预测用户话语的含义:
例如,如果我想描述一款名为 class 的平板电脑,我可以用来描述它的功能可能包括屏幕、尺寸、电池、颜色等。如果一句话提到任何功能,它会将 points/weight 添加到预测话语的含义是描述平板电脑的分数。然而,最好包含在短语列表中的特征是可能是外国的、专有的或可能只是罕见的词。例如,也许我会在平板电脑的短语列表中添加“SurfacePro”、“iPad”或“Wugz”(一个虚构的平板电脑品牌)。然后,如果用户的话语包含“Wugz”,则更多 points/weight 将用于预测 Tablet 是话语的正确实体。
或者可能意图是 Book.Flight,特征包括“Book”、“Flight”、“Cairo”、“Seattle”等。话语是“Book me a flight to Cairo”,points/weight 的分数 Book.Flight 将添加“Book”、“flight”、“Cairo”的意图。
现在,关于可互换和不可互换的短语列表。 也许我有一个城市短语列表,其中包括“西雅图”、“开罗”、“L.A”等。我会确保短语列表是 不可互换的 ,因为这表明是的,“西雅图”和“开罗”在某种程度上彼此相似,但它们不是同义词——我不能互换使用它们,也不能用一个代替另一个。 (“预订飞往开罗的航班”不同于“预订飞往西雅图的航班”) 但是,如果我有一个 Coffee 短语列表,其中包含“Coffee”、“Starbucks”、“Joe”等特征,并将该列表标记为可互换,那么我指定列表中的特征是 可互换。 (“我想要一杯咖啡”和“我想要一杯乔”的意思相同)
有关短语列表的更多信息 - Phrase List features in LUIS
有关改进预测的更多信息 - Tutorial: Add phrase list to improve predictions"