批处理节点重启和批处理池设置

Batch nodes restarting and batch pool settings

我有几个关于 Azure Batch 池的问题:

  1. 我注意到有时候,虽然 运行 一个作业,尤其是当我在 运行 大量任务时,比如 10000,some/many 中的计算节点我的池自行关闭并重新启动。我想知道什么会导致批处理池中的节点在执行过程中关闭并重新启动?

  2. 是否可以在创建池后更改 size/scale 以外的池配置参数?例如,我想更改 VM 的 sku 或每个节点的任务数设置。如果是,可以通过 Azure 门户完成还是必须以编程方式完成?

谢谢!

  1. 这需要由 Azure Batch 团队进行调查。您可以在门户中提出支持票证,您可以在其中指定您的帐户名称、区域、池 ID、作业 ID 以及发生这种情况的一些示例大概时间。如果您保持 VM 处于活动状态,这也会有所帮助。
  2. You can update any of the pool properties specified in this document;请注意,某些更新需要重新启动计算节点才能生效。对于您指定的两个特定参数(VM 大小和每个节点的最大任务数),遗憾的是这些参数无法在创建池后进行修补。您将需要使用新参数重新创建池,或者如果您需要在不停机的情况下耗尽现有作业,您可以创建一个新池并通过禁用具有您喜欢的重新排队选项的现有作业,修补作业以针对新池,然后重新启用作业。