Azure 虚拟机每 2-3 小时崩溃一次
Azure Virtual Machine Crashing every 2-3 hours
我们在 Azure 上有一个经典的 VM。它所做的只是 运行 SQL 服务器上有很多数据库(我们有另一个虚拟机,它是一个网络服务器,它是面向网络的一侧,可以访问 sql 经典虚拟机用于数据)。
我们遇到的问题是,从昨天早上开始,我们现在每 2-3 小时就会遇到一次中断。似乎没有任何理由。我们一直在与 Azure 支持人员合作,但他们似乎仍在努力找出问题所在。事件日志中似乎没有任何内容可以为我们提供任何信息。
所有发生的事情是我们收到一个 pingdom 警报,说盒子已经用完了,然后我们无法远程进入它,因为它超时并且对它的所有数据库调用都失败了。 5 分钟后它会恢复。它似乎没有完全重新启动或它只是拖拉的任何东西。
关于这可能是由什么引起的任何想法?或者我们可以在任何地方寻找更好的信息?或者如何解决这个问题?
事件日志中唯一似乎同时发生的事件是 DNS 客户端事件 "Name resolution for the name [DNSName] timed out after none of the configured DNS servers responded."
最聪明或快速恢复:
您是否通过使用本地主机或 127.0.0.1/实例名称连接到 VM(内部)内部来检查 SQL 服务器。如果您可以在内部连接 SQL 服务器而没有任何问题,然后 Capture 或快照 SQL 服务器虚拟机并使用捕获虚拟机创建新虚拟机(即不丢失任何数据)。
以下条件可能会导致此问题:
- Azure 网络防火墙
- Windows 服务器更新
这最终成为我们 VM 所在的 node/sector 的故障。我通过扩大我们的 VM 实例的大小(4 核到 8 核)来解决这个问题,这迫使 azure 将它移动到另一个 node/sector 并解决了这个问题。
我们在 Azure 上有一个经典的 VM。它所做的只是 运行 SQL 服务器上有很多数据库(我们有另一个虚拟机,它是一个网络服务器,它是面向网络的一侧,可以访问 sql 经典虚拟机用于数据)。
我们遇到的问题是,从昨天早上开始,我们现在每 2-3 小时就会遇到一次中断。似乎没有任何理由。我们一直在与 Azure 支持人员合作,但他们似乎仍在努力找出问题所在。事件日志中似乎没有任何内容可以为我们提供任何信息。
所有发生的事情是我们收到一个 pingdom 警报,说盒子已经用完了,然后我们无法远程进入它,因为它超时并且对它的所有数据库调用都失败了。 5 分钟后它会恢复。它似乎没有完全重新启动或它只是拖拉的任何东西。
关于这可能是由什么引起的任何想法?或者我们可以在任何地方寻找更好的信息?或者如何解决这个问题?
事件日志中唯一似乎同时发生的事件是 DNS 客户端事件 "Name resolution for the name [DNSName] timed out after none of the configured DNS servers responded."
最聪明或快速恢复:
您是否通过使用本地主机或 127.0.0.1/实例名称连接到 VM(内部)内部来检查 SQL 服务器。如果您可以在内部连接 SQL 服务器而没有任何问题,然后 Capture 或快照 SQL 服务器虚拟机并使用捕获虚拟机创建新虚拟机(即不丢失任何数据)。
以下条件可能会导致此问题:
- Azure 网络防火墙
- Windows 服务器更新
这最终成为我们 VM 所在的 node/sector 的故障。我通过扩大我们的 VM 实例的大小(4 核到 8 核)来解决这个问题,这迫使 azure 将它移动到另一个 node/sector 并解决了这个问题。