Azure 虚拟机每 2-3 小时崩溃一次

Azure Virtual Machine Crashing every 2-3 hours

我们在 Azure 上有一个经典的 VM。它所做的只是运行 SQL 服务器上有很多数据库（我们有另一个虚拟机，它是一个网络服务器，它是面向网络的一侧，可以访问 sql 经典虚拟机用于数据）。

我们遇到的问题是，从昨天早上开始，我们现在每 2-3 小时就会遇到一次中断。似乎没有任何理由。我们一直在与 Azure 支持人员合作，但他们似乎仍在努力找出问题所在。事件日志中似乎没有任何内容可以为我们提供任何信息。

所有发生的事情是我们收到一个 pingdom 警报，说盒子已经用完了，然后我们无法远程进入它，因为它超时并且对它的所有数据库调用都失败了。 5 分钟后它会恢复。它似乎没有完全重新启动或它只是拖拉的任何东西。

关于这可能是由什么引起的任何想法？或者我们可以在任何地方寻找更好的信息？或者如何解决这个问题？

事件日志中唯一似乎同时发生的事件是 DNS 客户端事件 "Name resolution for the name [DNSName] timed out after none of the configured DNS servers responded."

最聪明或快速恢复：

您是否通过使用本地主机或 127.0.0.1/实例名称连接到 VM（内部）内部来检查 SQL 服务器。如果您可以在内部连接 SQL 服务器而没有任何问题，然后 Capture 或快照 SQL 服务器虚拟机并使用捕获虚拟机创建新虚拟机（即不丢失任何数据）。

以下条件可能会导致此问题：

这最终成为我们 VM 所在的 node/sector 的故障。我通过扩大我们的 VM 实例的大小（4 核到 8 核）来解决这个问题，这迫使 azure 将它移动到另一个 node/sector 并解决了这个问题。