如何深入了解 AzureML 端点部署的异常和日志记录

How to get insights in exceptions and logging of AzureML endpoint deployment

由于我的 InferenceConfig 中的错误 score.py 文件,Model.Deploy 使用 ACI 的 Azure 机器学习失败。我想在云中创建端点,但我在门户中看到的唯一状态是不健康。我用于部署模型的本地脚本(使用 )保持 运行,直到超时。 (使用 service.wait_for_deployment(show_output=True) 语句)。

是否有选项可以在部署转向 "Unhealthy" 的实际 reason/error 消息中获得更多见解?

通常超时是由评分脚本中的init()函数错误引起的。您可以使用 print(service.get_logs()) 获取详细日志以查找 Python 错误。

有关更全面的故障排除指南,请参阅:

https://docs.microsoft.com/en-us/azure/machine-learning/how-to-troubleshoot-deployment