使用 Azure 认知服务在文本中搜索已知短语

Searching for known phrases in text using Azure Cognitive Services

我正在尝试在这里确定“适合这项工作的工具”,我相信认知服务可以做到这一点,但不会消失在研发的空洞中,我想我会确保我正在挖掘先说对的方向。

所以,这里是简介:

我有一组已知的现有短语,我想查找这些短语,但这些短语的书写方式可能略有不同,无论是语法还是语言。

我希望能够解析大量(可能很大)文本以进行扫描并查找这些短语,以便识别它们。

例如,我的短语可以是“the event will be in person”,但这也需要区分不同的语言用法;例如“面对面活动”、“面对面活动”或“现场活动”——以及您可以从这些事物中得到的各种同义词和变体。

LUIS 最初似乎是这类事情的首选工具,并且包括编写自己的功能(又名短语列表)来扩充模型的能力,但尚不清楚这是否会达到目的 - LUIS 似乎 更关注“意图”和用户交互(例如构建聊天机器人,或从电子邮件中理解意图) .

文本分析 似乎也是一个可能的候选人,但似乎更侧重于识别“实体”(例如人/地方/组织)而不是自然语言“短语” - 如果我正在定义自己的“主题”,这个工具会起作用吗?或者这真的只是在找错树吗?

.. 或...实际上还有其他我应该看的完全不同的东西吗?

此时 - 我真的在寻找“我应该花很多时间学习哪个工具”。

提前致谢 - 我明白这是一个相当开放的要求。

您的场景似乎更符合我们的文本分析服务。我打算推荐 Key Phrase Extraction API 评估非结构化文本和 returns 关键短语列表。但是,由于您需要使用已知(自定义)短语列表,它可能不是您正在寻找的解决方案。我们目前不支持自定义关键短语提取,但它在我们的路线图上。如果有兴趣,我们可以将您与产品团队联系起来,以详细了解您的场景。

更新: 请尝试 custom NER 功能。