Apache Mesos 是否识别 GPU 内核?

Does Apache Mesos recognize GPU cores?

在 Twitter 开源办公室负责人 this talk 的幻灯片 25 中,演示者说 Mesos 允许人们跟踪和管理 GPU(我假设他指的是 GPGPU)资源。但我在其他任何地方都找不到这方面的任何信息。有人可以帮忙吗?除了Mesos,还有其他支持GPGPU的集群管理器吗?

Mesos 尚未提供对 (GP)GPU 的直接支持,但支持自定义资源类型。如果您在启动 mesos-slave 时指定 --resources="gpu(*):8",那么这将成为提供给框架的资源的一部分,框架可以启动声称使用这些资源的任务。一旦任务使用了一些 gpu 资源,将再次提供剩余资源,直到该任务完成并且 gpu 资源再次可用。这样Mesos资源分配器就可以真正调度你声明的gpu资源,保证只有声明的数量offered/allocated给frameworks

Mesos 尚不支持 gpu 隔离,但使用 "pluggable isolator modules",您可以构建自己的 gpu 隔离器以强制执行 gpu 资源限制。

或者,如果您不想分配单独的 gpu 资源,而只想声明某些节点具有 gpu 而其他节点没有,您可以只使用 --attributes="hasGpu:true" 或类似的东西来区分节点do/do 没有 GPU。此信息也传递到资源提供中的框架,但这些属性不能由 运行 任务 "consumed",因此它们将始终为该节点提供。

有关详细信息,请参阅 https://mesos.apache.org/documentation/attributes-resources/