为 azureML 创建集群环境时出错:"Failed to get scoring front-end info"
Error when creating cluster environment for azureML: "Failed to get scoring front-end info"
我刚开始使用 Azure 机器学习服务,运行 解决了这个问题。创建本地环境并将我的模型部署到本地主机工作得很好。
任何人都可以确定是什么导致了这个错误,因为我不知道从哪里开始..
我也尝试为位置 "eastus2" 创建一个集群,这导致了同样的错误。
非常感谢您!
顺便说一句,正在将资源组和资源创建到我的 Azure 帐户中。
Image of error
阿什文 [MSFT]
得知您遇到问题,我们深感抱歉。我们使用您在屏幕截图中提供的信息检查了我们这边的日志。集群设置失败,因为没有足够的核心来适应集群中的 AzureML 和系统组件。您指定了具有 1 CPU 个核心的 D1v2 的 agent-vm-size。默认情况下,我们创建 2 个代理,因此核心总数为 2。要解决这个问题,您能否尝试创建一个新集群而不指定代理大小?然后 AzureML 将创建 2 个 D3v2 代理,总共 8 个核心。这应该适合 AzureML 和系统组件,并为您部署服务留出一些空间。
如果您想要一个更大的集群,您可以指定 agent-count 和 agent-vm-size 来适当地调整集群的大小,但是请至少有 8 个内核,每个单独的 VM >= 2 个内核,以确保集群顺利运行.希望这有帮助。
我们正在努力添加错误处理以确保请求失败并显示明确的错误消息。
我刚开始使用 Azure 机器学习服务,运行 解决了这个问题。创建本地环境并将我的模型部署到本地主机工作得很好。 任何人都可以确定是什么导致了这个错误,因为我不知道从哪里开始..
我也尝试为位置 "eastus2" 创建一个集群,这导致了同样的错误。 非常感谢您!
顺便说一句,正在将资源组和资源创建到我的 Azure 帐户中。
Image of error
阿什文 [MSFT]
得知您遇到问题,我们深感抱歉。我们使用您在屏幕截图中提供的信息检查了我们这边的日志。集群设置失败,因为没有足够的核心来适应集群中的 AzureML 和系统组件。您指定了具有 1 CPU 个核心的 D1v2 的 agent-vm-size。默认情况下,我们创建 2 个代理,因此核心总数为 2。要解决这个问题,您能否尝试创建一个新集群而不指定代理大小?然后 AzureML 将创建 2 个 D3v2 代理,总共 8 个核心。这应该适合 AzureML 和系统组件,并为您部署服务留出一些空间。
如果您想要一个更大的集群,您可以指定 agent-count 和 agent-vm-size 来适当地调整集群的大小,但是请至少有 8 个内核,每个单独的 VM >= 2 个内核,以确保集群顺利运行.希望这有帮助。
我们正在努力添加错误处理以确保请求失败并显示明确的错误消息。