使用集群时出现 Azure Automl Job Configuration MaxSize Exceeded 错误
Azure Auto ML JobConfigurationMaxSizeExceeded error when using a cluster
当我尝试 运行 通过工作室在 GPU 计算集群上进行自动化 ML 时,我 运行 遇到了以下错误:
Error: AzureMLCompute job failed. JobConfigurationMaxSizeExceeded: The
specified job configuration exceeds the max allowed size of 32768
characters. Please reduce the size of the job's command line arguments
and environment settings
尝试的 运行 是在文件存储中注册的表格数据集上,是一个简单的回归案例。奇怪的是,它与我用于其他管道的 CPU 计算实例配合得很好。我已经能够 运行 它几次使用它并且想升级到一个集群只是被这个错误击中。我在网上查到可能是这样设置的情况:AZUREML_COMPUTE_USE_COMMON_RUNTIME:false;但我不知道从网络工作室 运行ning 时把它放在哪里。
这是一个已知错误。我正在跟进产品组,看看是否有针对此错误的任何更新。对于您提到的解决方法,它需要您转到因 JobConfigurationMaxSizeExceeded 异常而失败的节点,并在其环境 JSON 字段中手动设置 AZUREML_COMPUTE_USE_COMMON_RUNTIME:false。
节点如下截图
看来该错误已修复。我只是 运行 它在集群上而不更改任何参数。谢谢宇通的帮助!
当我尝试 运行 通过工作室在 GPU 计算集群上进行自动化 ML 时,我 运行 遇到了以下错误:
Error: AzureMLCompute job failed. JobConfigurationMaxSizeExceeded: The specified job configuration exceeds the max allowed size of 32768 characters. Please reduce the size of the job's command line arguments and environment settings
尝试的 运行 是在文件存储中注册的表格数据集上,是一个简单的回归案例。奇怪的是,它与我用于其他管道的 CPU 计算实例配合得很好。我已经能够 运行 它几次使用它并且想升级到一个集群只是被这个错误击中。我在网上查到可能是这样设置的情况:AZUREML_COMPUTE_USE_COMMON_RUNTIME:false;但我不知道从网络工作室 运行ning 时把它放在哪里。
这是一个已知错误。我正在跟进产品组,看看是否有针对此错误的任何更新。对于您提到的解决方法,它需要您转到因 JobConfigurationMaxSizeExceeded 异常而失败的节点,并在其环境 JSON 字段中手动设置 AZUREML_COMPUTE_USE_COMMON_RUNTIME:false。
节点如下截图
看来该错误已修复。我只是 运行 它在集群上而不更改任何参数。谢谢宇通的帮助!