用于批处理的多区域 GKE 集群
Multi-zonal GKE cluster for batch processing
我正在使用 GKE 区域集群上的自动缩放可抢占节点批处理数据。 GPU 时不时地变得稀缺。我没有切换区域来追逐 GPU(我已经做过),而是尝试更改为多区域配置。在我看来,在一些轻型到中型工作负载上似乎一切正常。
我在 UI 中看到有关不平衡节点池的警告,因为节点池似乎在有可用资源的区域中扩展。这个警告是认真的吗?不同区域的不同节点号有什么影响?我应该改为 运行 每个区域单独的池吗?
我在节点之间有相当多的通信量 -- 我的带宽受到位于不同区域的工作人员的影响有多大? GKE docs表示没有入口限制,只是出口比区域内慢,比区域间快。
我正在使用 GKE 区域集群上的自动缩放可抢占节点批处理数据。 GPU 时不时地变得稀缺。我没有切换区域来追逐 GPU(我已经做过),而是尝试更改为多区域配置。在我看来,在一些轻型到中型工作负载上似乎一切正常。
我在 UI 中看到有关不平衡节点池的警告,因为节点池似乎在有可用资源的区域中扩展。这个警告是认真的吗?不同区域的不同节点号有什么影响?我应该改为 运行 每个区域单独的池吗?
我在节点之间有相当多的通信量 -- 我的带宽受到位于不同区域的工作人员的影响有多大? GKE docs表示没有入口限制,只是出口比区域内慢,比区域间快。