GPU 和 google 容器引擎
GPUs and google container engine
Kubernetes 支持 GPU 作为一项实验性功能。它在 google 容器引擎中工作吗?我是否需要一些特殊配置才能启用它?我希望能够 运行 机器学习工作负载,但想使用 CloudML 中不可用的 Python 3。
恐怕这不是开箱即用的支持。在 Google Compute Engine (GCE) 中创建常规实例时,您可以 select 为您的机器设置 GPU 规格。另一方面,在创建集群时,这些选项不可用。我想这迟早会可用,但不是现在。
作为替代方案,您可以使用 kubeadm 等工具创建多个 GCE 实例并构建集群,或者按照困难的方式遵循 Kubernetes 等指南:https://github.com/kelseyhightower/kubernetes-the-hard-way
Google 容器引擎上的 GPU 现在可用于 Alpha 版。 Sign up form.
注意 alpha cluster limitations 适用:它们无法升级,并且会在 30 天后自动删除。
免责声明:我在 GCP 工作。
我没有测试过,但只要 GPU 虚拟机只是机器类型,我会说执行这两个步骤应该使它可行:
更新:自定义机器类型的主要站点:https://cloud.google.com/custom-machine-types/
1- 创建 GPU 自定义机器类型:https://cloud.google.com/compute/docs/gpus/
You can add GPUs to any non-shared-core predefined machine type or custom machine type that you are able to create in a zone
2- 创建节点时,在您的集群或节点池中选择您的自定义机器类型:https://cloud.google.com/container-engine/docs/clusters/operations
--machine-type: The Google Compute Engine machine type (e.g. n1-standard-1) to use for instances in this container cluster. If unspecified, the default machine type is n1-standard-1
Kubernetes 支持 GPU 作为一项实验性功能。它在 google 容器引擎中工作吗?我是否需要一些特殊配置才能启用它?我希望能够 运行 机器学习工作负载,但想使用 CloudML 中不可用的 Python 3。
恐怕这不是开箱即用的支持。在 Google Compute Engine (GCE) 中创建常规实例时,您可以 select 为您的机器设置 GPU 规格。另一方面,在创建集群时,这些选项不可用。我想这迟早会可用,但不是现在。
作为替代方案,您可以使用 kubeadm 等工具创建多个 GCE 实例并构建集群,或者按照困难的方式遵循 Kubernetes 等指南:https://github.com/kelseyhightower/kubernetes-the-hard-way
Google 容器引擎上的 GPU 现在可用于 Alpha 版。 Sign up form.
注意 alpha cluster limitations 适用:它们无法升级,并且会在 30 天后自动删除。
免责声明:我在 GCP 工作。
我没有测试过,但只要 GPU 虚拟机只是机器类型,我会说执行这两个步骤应该使它可行:
更新:自定义机器类型的主要站点:https://cloud.google.com/custom-machine-types/
1- 创建 GPU 自定义机器类型:https://cloud.google.com/compute/docs/gpus/
You can add GPUs to any non-shared-core predefined machine type or custom machine type that you are able to create in a zone
2- 创建节点时,在您的集群或节点池中选择您的自定义机器类型:https://cloud.google.com/container-engine/docs/clusters/operations
--machine-type: The Google Compute Engine machine type (e.g. n1-standard-1) to use for instances in this container cluster. If unspecified, the default machine type is n1-standard-1