处理 qna maker 中的限制 and/or 配额

Handle throttling and/or quota in qna maker

如何处理 qna maker 中的限制 and/or 配额?相信不止我一个人有这个问题,也许你会给我一些想法。

我有一个可以处理特定问题的聊天机器人,但用户也可以输入自由文本,所以我希望能够回答一些社交问题,例如嗨、你好、再见、谢谢或咒骂。所以 QnA 接缝非常适合这个。

问题是 10k 请求配额意味着每天大约 300 个请求。 假设每天有 30 次聊天,平均处理时间为 10-15 分钟,问题很多,我认为已经超过配额了。

有什么想法吗?

QnA Maker 自 2018 年 5 月 7 日起正式发布。随着 GA 的发布,QnA Maker 的架构发生了变化。

QnA Maker announced General Availability on May 7, 2018 at the \build\ conference. QnA Maker GA has a new architecture built on Azure. Knowledge bases created with QnA Maker Free Preview will need to be migrated to QnA Maker GA. QnA Maker Preview will be deprecated in November 2018. For more information about the changes in QnA Maker GA, see the QnA Maker GA announcement blog post.

对于 GA,QnA 管理和底层 Azure 搜索服务有很多定价层。这些层中没有一个对请求有限制,所以这个问题不再有效。

如果未来的读者想要克服其他缩放限制,请参阅有关如何构建缩放的 QnA Maker 基础结构的文档。

参见https://docs.microsoft.com/en-us/azure/cognitive-services/qnamaker/how-to/business-continuity-plan

这是为了业务连续性,但也可以很容易地适应扩展场景。