Camunda 流程存储库中的性能和指标

Performance and indexes in Camunda process repository

camunda

几天来，我一直在评估 camunda 在我的 Tomcat 应用程序中使用 embedded，但我对 [=32= 提出了一些性能担忧]assignees 和变量，以进一步过滤我的存储库。有一些简单的用例场景对我有实际用处：

1) 筛选分配给特定用户的所有活动任务。

2) 筛选与客户关联的所有活动流程实例。

3) 从与客户关联的流程实例中过滤所有活动任务。

所以我更担心的是：

a - 我可以依赖用例 1 具有 数据库索引 的受让人，这些受让人将来会很好地执行人口密集的任务 table 吗？

b - 为了完成用例 2，我会将客户 ID 作为 流程级变量 添加到我的流程实例中以进一步过滤它们。 variables 是否也被索引 - 假设受让人是？（假设我需要查询具有给定变量集的 100 万个进程中的 20 个进程 table）

c - 最后，从性能的角度来看，我是否应该在每个任务中复制客户 id 变量，然后过滤它们而不检查相应的流程实例？

ps1：我使用的是postgres数据库作为存储库，对BPM引擎下的底层结构和索引没有完全的了解。如果需要一些理解来创建默认情况下不可用的索引，我希望能提供一些线索 tables/columns 我应该继续努力。

ps2：我不是在处理关键的并发软件，但在不久的将来可能会有很大的数据库负载。

如果您对数据库结构等感兴趣，可以查看一些内容。数据库结构在[1]

中描述

您还可以通过查看预打包的发行版来查看数据库创建脚本。对于 Tomcat，查看文件夹 sql/create。

回答您的具体问题；有个叫ACT_RU_TASK的table。这具有运行时任务。查看 Postgresql 的 SQL 脚本，在 ACT_RU_TASK(ASSIGNEE_) 上有一个索引 ACT_IDX_TASK_ASSIGNEE。因此看起来任务分配者有一个索引。

变量稍微复杂一些，因为变量类型可能决定它的实际存储位置。

businessKey 上有一个索引，因此如果您使用 businessKey 来存储客户 ID，您可能会从 businessKey 中获得一些牵引力。

除了必要时在适当的位置添加索引外，另一种要考虑的技术是添加您自己的 table，这是引擎中的索引。例如，使用任务或流程生命周期事件侦听器等，您可以使 table 与查找值保持同步。因此，您可以保留 table 客户 ID 和流程或任务 ID，或某个变量和任务 ID 等。一旦 table 到位，您就可以添加客户 sql 或插件使用该功能。

[1] https://docs.camunda.org/manual/7.4/user-guide/process-engine/database/

（由 Webcyberrob 在 https://forum.camunda.org/t/performance-and-indexes-in-camunda-process-repository/650 回答）