在我们的发现集群上增加 yarn 容器的利用率所需的建议

Suggestions required in increasing utilization of yarn containers on our discovery cluster

当前设置

问题陈述

我们正在考虑的选项

请求

  1. 是否有任何其他方法可以管理我们的发现集群。
  2. 是否有减小容器尺寸的可能性。
  3. 一个 vcore(因为它是一个逻辑概念)可以被多个容器共享吗?

Vcores 只是一个逻辑单元,与 CPU 核心无关,除非您使用 YARN with CGroups 并启用 yarn.nodemanager.resource.percentage-physical-cpu-limit。大多数任务很少 CPU 绑定,但更常见的是网络 I/O 绑定。因此,如果您要查看集群的整体 CPU 利用率和内存利用率,您应该能够根据浪费的(备用)容量调整容器的大小。

您可以使用许多工具来衡量利用率,但 sargangliagrafana 是显而易见的工具,但您也可以查看 Brendan Gregg 的 Linux Performance tools更多想法。