Azure HPC 集群 AutoGrowShrink 未触发
Azure HPC Cluster AutoGrowShrink Not Triggering
我确实在 Azure 中使用 1 个头节点和 2 个计算节点设置了 Azure HPC 集群,工作正常。我能够从 Excel 提交作业,完美地返回结果。
现在,我正在尝试自动缩放集群,我已将证书上传到 Azure 订阅并更新了头节点上的证书存储和注册表,如此处所述。
我已经使用 PS 设置了 AutoGrowShrink 属性,它似乎也设置正确。
PS C:\Program Files\Microsoft HPC Pack 2012\Bin> Get-HpcClusterProperty -AutoGrowShrink
Name Value
---- -----
EnableGrowShrink True
TasksPerResourceUnit 1
GrowThreshold 1
GrowInterval 3
ShrinkInterval 5
ShrinkIdleTimes 3
ExtraNodesGrowRatio 1
GrowByMin True
SoaJobGrowThreshold 50000
SoaRequestsPerCore 20000
但是,当我提交需要更多内核的作业时,它会永远排队并且新的计算节点不会添加到 HPC 集群(AutoGrowShrink 不会触发)。知道我可能遗漏了什么。
Hpc auto grow shrink 无法自动将计算节点添加到集群,您需要先将节点添加到您的 HPC IaaS 集群,然后如果启用 auto grow shrink,它可以在没有作业时停止节点,并启动节点什么时候有新工作。
我确实在 Azure 中使用 1 个头节点和 2 个计算节点设置了 Azure HPC 集群,工作正常。我能够从 Excel 提交作业,完美地返回结果。
现在,我正在尝试自动缩放集群,我已将证书上传到 Azure 订阅并更新了头节点上的证书存储和注册表,如此处所述。
我已经使用 PS 设置了 AutoGrowShrink 属性,它似乎也设置正确。
PS C:\Program Files\Microsoft HPC Pack 2012\Bin> Get-HpcClusterProperty -AutoGrowShrink
Name Value
---- -----
EnableGrowShrink True
TasksPerResourceUnit 1
GrowThreshold 1
GrowInterval 3
ShrinkInterval 5
ShrinkIdleTimes 3
ExtraNodesGrowRatio 1
GrowByMin True
SoaJobGrowThreshold 50000
SoaRequestsPerCore 20000
但是,当我提交需要更多内核的作业时,它会永远排队并且新的计算节点不会添加到 HPC 集群(AutoGrowShrink 不会触发)。知道我可能遗漏了什么。
Hpc auto grow shrink 无法自动将计算节点添加到集群,您需要先将节点添加到您的 HPC IaaS 集群,然后如果启用 auto grow shrink,它可以在没有作业时停止节点,并启动节点什么时候有新工作。