Pentaho BI 服务器负载测试 - 可能出现死锁

Pentaho BI Server load test - Possible deadlock

我们目前正在对 BI 基础架构进行负载测试。我们正在针对单个 pentaho 节点(双服务器平台)测试 10 个并发用户

每个用户的测试场景是:

  1. 打开 pentaho 页面
  2. 向平台验证
  3. 使用 URL 打开报告(像这样 http://itrac5125:8080/pentaho/api/repos/%3Ahome%3ALoadTesting%3A4Measures.xanalyzer/editor
  4. 刷新报表后转到 3) 并打开另一个报表

如您所见,第 3 步和第 4 步在循环中。

此测试 运行 15 分钟后,BI 平台变得极度无响应。加载主页需要将近三分钟。加载后,尝试按“浏览文件”/“创建 nnw”等按钮不会导致视图发生任何变化。

我们使用 java 探查器工具来分析应用程序内部发生的情况,并发现了 200 个 http 线程 (请参阅线程)附件。其中大约 95% 的人大部分时间都被阻塞 等待资源 (请参阅已阻塞)。 这正常吗? 恐怕管理这么多正在等待资源的线程对处理器来说可能是一个相当大的开销。查了BI平台的代码(见代码),确实有一个资源锁,从这个方法里面等待的线程数来看,好像经常重新计算。

线程 (http://postimg.org/image/4c2yug17f/full/) 已阻止 (http://postimg.org/image/gm32nbd29/) 代码 (http://postimg.org/image/6p5vt1b6r/)

同时附上 cpu 和 ram 使用图,这些图是在执行测试的时间段内拍摄的。 CPU (http://postimg.org/image/tbxubog6b/full/): 内存(http://postimg.org/image/jecpimes9/full/):

有没有人遇到类似的问题?我很高兴听到关于 Pentaho BI 服务器的负载测试/负载优化方面的其他经验。

经过一个多星期的测试,结果证明是 Pentaho 方面的一个问题,与导致死锁的线程同步错误有关。

我们已经与 Pentaho 联系,他们确认这是他们方面的一个错误(参见 jira:http://jira.pentaho.com/browse/BISERVER-12642)。这应该在 Pentaho 5.4 的服务包中修复。