今天收到不少 SQL Azure 连接问题,强制断开连接,如何从 MS 获取更多信息以及如何监控?

Getting quite a few SQL Azure connection issues today, and forced disconnections, how to get more information from MS and also how to monitor?

我们使用北欧 Azure 数据中心。我们将 SQL Azure Web Edition 与网站一起使用。今天我们似乎遇到了很多 SQL Azure 断开连接错误代码 10054:

症状:

A transport-level error has occurred when receiving results from the server. An established connection was aborted by the software in your host machine

缓解措施:

Implement retry logic in your application

令人沮丧的是,我找不到任何针对某个问题的 MS Azure 警报。我怀疑他们的 SQL Azure 系统会响起警报。我查看了 Azure Status 和管理服务。

我可以在其他地方查找这些警报吗?通知 MS 存在问题的最佳方式是什么。

最后,人们如何监控 SQL Azure 的问题、节流、断开连接等?我遇到过 cotega.com.

P.s 作为旁注,我确实理解放入 "retry logic" 的重要性,但不会很快发生,我的代码可以在这方面进行改进。然而,今天的 SQL Azure 似乎确实有些问题。到目前为止,这项服务总体上还是很棒的。

编辑 1:

错误代码:

Error Number:10054,State:0,Class:20

编辑 2:

我认为这个故事的寓意是不要低估 SQL Azure 服务的节流和扩展而不是扩展的影响,以及实现重试逻辑/MS 瞬态模式逻辑的重要性.尽管如此,这种可变性能还是有点令人沮丧,但也许这就是适合您的云,尽管使用新的数据层您可以为更高的可预测性付费。

编辑 3:有趣的是 SQL Azure 没有更有效地执行并且没有发现任何错误。所以 Azure 有问题。但是很难从应用程序错误日志中识别出来。我用的是Elmah。

重新配置发生在对服务进行升级或数据库负载平衡以避免嘈杂的邻居问题时。

主数据库中的视图 sys.event_log 包含有关断开连接发生原因的信息(重新配置与限制等)。

门户中报告了服务中断。