Rasa 服务器的最低系统要求和并行客户端请求数量的限制?

Minimum system requirements to Rasa server and limitation of number of client requests coming in parallel?

我已经开始探索 Rasa 并计划从 Dialogflow 切换到 Rasa。然而,截至目前,我多次尝试通过浏览 Rasa 文档和以前的论坛帖子(如 RASA Chatbot | System Requirement and Minimum/Recommended System Requirements for RASA(NLU+Core))来回答以下两个问题,但都没有成功,因为答案中提供的链接已损坏。可能是因为这些链接不再有效。

所以这是我的两个问题:

  1. 托管 Rasa 服务器的最低和推荐系统要求是什么?
  2. 最大号是多少? Rasa 服务器可以并行处理的客户端请求?

提前致谢。

What is the minimum and recommended system requirement to host a Rasa Server?

这在很大程度上取决于您的型号。如果您使用的是预训练嵌入(例如 spaCy 嵌入),那么模型本身已经有几千兆字节了。此外,使用的策略数量和使用的 NLU 组件会严重影响性能(例如,1 个策略显然比使用 5 个策略快)。因此,最好使用您的配置和模型设置负载测试。

What is the maximum no. of client request a Rasa server can process in parallel?

Rasa (1.x) 使用 sanic 网络服务器。 Rasa 使用 1 个 sanic worker,这意味着它在进程上运行。所以从技术上讲,当时只处理了一个请求。但是,Sanic 异步运行,这意味着它可以在当前请求被阻止时处理其他请求(例如,因为它正在等待来自您的自定义操作服务器的响应)。