AWS EC2 t2.micro 实例非常不稳定

Question

我是运行 AWS EC2 t2.micro 实例上的一个 wordpress 页面。没什么特别的，只是一个简单的 wordpress 网站。

每隔几周就会发生这种情况：

我的页面将无法访问，ssh 也无法访问
检查仪表板时，一切正常，没有警告或投诉
在 AWS 管理面板上重新启动它，其中一项检查将失败："Instance reachability check failed at (time) "

系统日志显示存在内核错误（下面复制了所有日志）。什么会导致这个？ AWS 方面的硬件不好？这真的让我很困惑，请帮忙。谢谢！

[2950123.794183] end_request: I/O error, dev xvda, sector 13514688
[2950123.797618] end_request: I/O error, dev xvda, sector 13514712
[2950123.798170] end_request: I/O error, dev xvda, sector 13514776
[2950123.798170] end_request: I/O error, dev xvda, sector 13514816
[2950123.798170] end_request: I/O error, dev xvda, sector 13514872
[2950123.798170] end_request: I/O error, dev xvda, sector 12894512
[2950123.798170] end_request: I/O error, dev xvda, sector 12875536
[2950123.798170] end_request: I/O error, dev xvda, sector 511456
[2950123.798170] end_request: I/O error, dev xvda, sector 13403944
[2950123.798170] end_request: I/O error, dev xvda, sector 515968
[2950124.114201] Kernel panic - not syncing: Attempted to kill init! exitcode=0x00000007
[2950124.114201] 
[2950124.118093] CPU: 0 PID: 1 Comm: init Not tainted 3.14.35-28.38.amzn1.x86_64 #1
[2950124.118093] Hardware name: Xen HVM domU, BIOS 4.2.amazon 05/06/2015
[2950124.118093]  ffff88003d578ae0 ffff88003da2bc80 ffffffff814867ca ffffffff81788cf0
[2950124.118093]  ffff88003da2bcf8 ffffffff814825ab ffffffff00000010 ffff88003da2bd08
[2950124.118093]  ffff88003da2bca8 ffffffff81c9af20 0000000000000007 ffff88003da30480
[2950124.118093] Call Trace:
[2950124.118093]  [<ffffffff814867ca>] dump_stack+0x45/0x56
[2950124.118093]  [<ffffffff814825ab>] panic+0xc8/0x1cd
[2950124.118093]  [<ffffffff8105ffd1>] do_exit+0xa41/0xa50
[2950124.118093]  [<ffffffff8106005f>] do_group_exit+0x3f/0xa0
[2950124.118093]  [<ffffffff8106f707>] get_signal_to_deliver+0x1c7/0x6e0
[2950124.118093]  [<ffffffff81014458>] do_signal+0x48/0x6f0
[2950124.118093]  [<ffffffff811e7c38>] ? fsnotify+0x228/0x2f0
[2950124.118093]  [<ffffffff81014b68>] do_notify_resume+0x68/0x90
[2950124.118093]  [<ffffffff8148d822>] retint_signal+0x48/0x86

Answer 1

您应该将解决方案设计为失败。失败是不可避免的，但是aws提供了所有的服务来处理问题。

在自动缩放组中设置您的 ec2 实例，以及 create/setup AWS 可以用来确定您的实例是否运行正常的健康检查。

如果您设置正确，当 AWS 发现您的实例是 failing/failed 时，它会自动将您的实例替换为另一个实例。

这将需要您的部分工作来正确构建事物，但是您将不再需要担心 watching/checking ou 实例并在出现问题时启动一个新实例。

http://docs.aws.amazon.com/AutoScaling/latest/DeveloperGuide/WhatIsAutoScaling.html

不要将您的 EC2 实例视为普通的托管服务提供商包，即您购买并放置您的解决方案并期望它永远运行。如果那是您的计划，那么您最好选择正规的托管服务提供商 - 他们会通过为您管理基础 hardware/software 来确保您的网站永远运行。

如果您要使用 AWS，请利用他们的平台。

至于您的具体问题，我倾向于认为内存泄漏 - 症状听起来不错，您一次运行s days/weeks 重新开始，然后崩溃。

AWS EC2 t2.micro 实例非常不稳定

AWS EC2 t2.micro instance very unstable

reboot

amazon-ec2

amazon-web-services