重试使用 Azure Batch 删除池或作业?

Retry deleting pool or jobs using Azure Batch?

我正在使用 this Microsoft tutorial 作为使用 Azure Batch 池、作业和容器的起点。

我已将他们用于删除池和作业的代码稍微更改为

// Cleanup Batch Account Resources
// Clean up Job
await batchClient.JobOperations.DeleteJobAsync($"{BatchConstants.JobIdPrefix}-{Guid}");
            
// Clean up Pool
await batchClient.PoolOperations.DeletePoolAsync($"{BatchConstants.PoolIdPrefix}-{Guid}");

当我在本地 运行 此代码时效果很好,但是当它进入我的开发环境时,它 运行 在删除池或作业(通常是作业)时会遇到问题。我收到状态代码“ServiceUnavailable”。

当我手动登录到 Azure 门户时,我可以看到容器已被毫无问题地删除(所以我知道可以建立连接并且可以成功删除 Azure 对象),但请注意池和作业仍然存在还活着。

JobOperationsPoolOperations 似乎没有重试策略的概念,所以有没有其他方法可以让它重试删除池 and/or 作业几次如果它返回 ServiceUnavailable 状态?或者我是否应该在本质上是一个 for 循环中尝试它,如果它返回一个错误的状态代码,最多 运行s 最多 5(或更多)次,或者如果返回一个良好的状态代码,则继续执行程序的其余部分?

感谢您的帮助。

您可以在 batchClient 本身上提供重试策略,该策略将应用于所有可重试的操作(即,如果是可重试操作,客户端将自动代表您重试该操作)。例如,要添加每 5 秒重试一次最多 10 次的线性重试策略:

batchClient.CustomBehaviors.Add(RetryPolicyProvider.LinearRetryProvider(TimeSpan.FromSeconds(5), 10))

您可以使用任何 existing retry policies or create your own retry policy by implementing the IRetryPolicy 界面。

通常 ServiceUnavailable 会由于某些临时中断或问题自行恢复。然而话虽如此,您可能仍然需要处理即使这些重试策略在最大尝试次数后失败的情况。这将取决于您的场景可以接受的内容,例如,您可能认为作业删除失败的时间较长,但池删除失败的时间超过一段时间是不行的。在这种情况下,您可能希望包含更强大的重试处理或系统中的回退警报和通知。