启用了虚拟节点和未启用虚拟节点的 AKS 群集
AKS Cluster with virtual node enabled and without virtual node enabled
我想将 Kubeflow 安装到 Azure 中,所以我开始创建一个带有 单节点(B4MS 虚拟机) 的 Azure Kubernetes 集群 (AKS)。在安装过程中,我没有启用 虚拟节点池 选项。创建 AKS 群集后,我 运行 命令“$ kubectl describe node aks-agentpool-3376354-00000
”检查规格。 Pods 的可分配数量是 110,我能够毫无问题地安装 Kubeflow。但是,一段时间后我想要一个启用了虚拟节点池的 AKS 集群,这样我就可以使用 GPU 进行训练。因此,我删除了旧集群并使用相同的 B4MS 虚拟机创建了一个新的 AKS 集群,并启用了虚拟节点池选项。这次当我 运行 与上面相同的命令来描述节点规格时, Pods 的可分配数量是 30 并且由于缺少kubeflow而导致安装失败pods 提供。
有人能解释一下为什么启用或禁用虚拟节点选项时可分配的数量 Pods 会发生变化吗?如何在启用虚拟节点池选项的同时将可分配的数量 Pods 保持为 110?
提前致谢!
虚拟节点池需要使用 AKS 的 Advance Networking 配置,它引入了 AZURE CNI 网络插件。
使用 AZURE CNI 时,AKS 上每个节点的默认 POD 计数为 30 pods。
https://docs.microsoft.com/en-us/azure/aks/configure-azure-cni#maximum-pods-per-node
这是您现在每个节点获得 30 MAX pods 的主要原因。
当使用 AZ CLI 配置集群时,这可以更新为更大的数字。
--max-pods -m
The maximum number of pods deployable to a node.
我想将 Kubeflow 安装到 Azure 中,所以我开始创建一个带有 单节点(B4MS 虚拟机) 的 Azure Kubernetes 集群 (AKS)。在安装过程中,我没有启用 虚拟节点池 选项。创建 AKS 群集后,我 运行 命令“$ kubectl describe node aks-agentpool-3376354-00000
”检查规格。 Pods 的可分配数量是 110,我能够毫无问题地安装 Kubeflow。但是,一段时间后我想要一个启用了虚拟节点池的 AKS 集群,这样我就可以使用 GPU 进行训练。因此,我删除了旧集群并使用相同的 B4MS 虚拟机创建了一个新的 AKS 集群,并启用了虚拟节点池选项。这次当我 运行 与上面相同的命令来描述节点规格时, Pods 的可分配数量是 30 并且由于缺少kubeflow而导致安装失败pods 提供。
有人能解释一下为什么启用或禁用虚拟节点选项时可分配的数量 Pods 会发生变化吗?如何在启用虚拟节点池选项的同时将可分配的数量 Pods 保持为 110? 提前致谢!
虚拟节点池需要使用 AKS 的 Advance Networking 配置,它引入了 AZURE CNI 网络插件。
使用 AZURE CNI 时,AKS 上每个节点的默认 POD 计数为 30 pods。
https://docs.microsoft.com/en-us/azure/aks/configure-azure-cni#maximum-pods-per-node
这是您现在每个节点获得 30 MAX pods 的主要原因。
当使用 AZ CLI 配置集群时,这可以更新为更大的数字。
--max-pods -m
The maximum number of pods deployable to a node.