如何在一段时间无负载后解决托管 QnA Maker/Azure 认知搜索服务的高延迟问题

How to address high latency on Managed QnA Maker/Azure Cognitive Search Service after a period of no load

如何防止Azure认知搜索服务在一段时间无负载后变冷?

我在聊天机器人(Managed QnA Maker Service 版本)中使用 QnaMaker。

QnaMaker 似乎在一段时间未使用后闲置了。第一个查询需要 7 秒才能完成。第一个查询之后的每个查询都在一秒钟内完成。

聊天机器人本身(使用 Microsoft Bot Framework V4 nodejs 开发)没有延迟。即使一段时间未使用(感谢机器人应用程序服务中的“始终在线”功能)

我使用 QnaMaker 的稳定 GA 版本和托管版本(预览版)。在第一个版本中,QnaMaker 的应用程序服务启用了“Always On”功能。对于预览版,没有我可以检查的应用服务。

聊天机器人代码初始化QnaMaker

const { QnAMaker } = require('botbuilder-ai');
        const endpoint_fr = {
            knowledgeBaseId: process.env.QnAKbId_fr,
            endpointKey: process.env.QnaEndpointKey_fr,
            host: process.env.QnaHostName_fr
        };
        try {
            this.qnaMaker_fr = new QnAMaker(endpoint_fr, {});
        } catch (err) {
            console.warn(`QnAMaker Exception: ${err} Check your QnAMaker configuration in .env`);
        } 

实际调用 QnAMaker 服务

   qnaResults = await this.qnaMaker_fr.getAnswers(stepContext.context);

QnAMaker 堆栈链接到 Azure 搜索资源。我正在使用的定价层基本(1 个副本、分区和搜索单元)10 个索引正在使用(允许 15 个)来存储 7 个知识库。地点是西欧。

如何防止 Azure 认知搜索服务在一段时间无负载后变冷?

[更新] 进行了更多挖掘并得出结论,即此冷启动仅发生在(预览)托管服务中的知识库中。我决定将所有 KB 移动到稳定版本,冷启动问题就停止了。这也可能与我在西欧并且托管版本仅在北欧可用有关

很高兴您使用“永远在线”。 QnA Maker 团队有时建议使用 Azure app insights monitor 添加快速 availability/web 测试(参见 https://docs.microsoft.com/azure/azure-monitor/app/monitor-web-app-availability)。这本质上是每隔几秒一次探测服务,可以解决冷启动问题。

我不确定 App Insights,但我确实 运行 针对 QnA Maker 服务进行了定期测试,主要是为了监控正常运行时间,但它会兼作保持服务“温暖”。我设置了一个 Azure 函数(链接到与 QnA Maker 应用服务相同的应用服务计划),并让它以定义的时间间隔进行标准 REST 查询(我使用 15 分钟,你可以使用任何东西,特别是如果你正在使用标准服务层没有限制或查询数量的额外费用)。您只需要从资源中获取适当的密钥即可发出请求并将其存储在您的配置或 Key Vault 中,我假设您已经从您的机器人本身熟悉了它。不应为您增加任何成本。

如果仅通过 ping 就可以使服务保持温暖,Jennifer 的建议可能会奏效,但我可以告诉你,我 运行ning 通过的自动化测试没有 0 个问题Azure 函数。

我将我所有的 QNA 知识库移回了稳定版。托管版本似乎导致冷启动。不知道为什么,但我的机器人又开始表演了。