AWS EC2 t2.micro 实例非常不稳定
AWS EC2 t2.micro instance very unstable
我是 运行 AWS EC2 t2.micro 实例上的一个 wordpress 页面。没什么特别的,只是一个简单的 wordpress 网站。
每隔几周就会发生这种情况:
- 我的页面将无法访问,ssh 也无法访问
- 检查仪表板时,一切正常,没有警告或投诉
- 在 AWS 管理面板上重新启动它,其中一项检查将失败:"Instance reachability check failed at (time) "
系统日志显示存在内核错误(下面复制了所有日志)。什么会导致这个? AWS 方面的硬件不好?这真的让我很困惑,请帮忙。谢谢!
[2950123.794183] end_request: I/O error, dev xvda, sector 13514688
[2950123.797618] end_request: I/O error, dev xvda, sector 13514712
[2950123.798170] end_request: I/O error, dev xvda, sector 13514776
[2950123.798170] end_request: I/O error, dev xvda, sector 13514816
[2950123.798170] end_request: I/O error, dev xvda, sector 13514872
[2950123.798170] end_request: I/O error, dev xvda, sector 12894512
[2950123.798170] end_request: I/O error, dev xvda, sector 12875536
[2950123.798170] end_request: I/O error, dev xvda, sector 511456
[2950123.798170] end_request: I/O error, dev xvda, sector 13403944
[2950123.798170] end_request: I/O error, dev xvda, sector 515968
[2950124.114201] Kernel panic - not syncing: Attempted to kill init! exitcode=0x00000007
[2950124.114201]
[2950124.118093] CPU: 0 PID: 1 Comm: init Not tainted 3.14.35-28.38.amzn1.x86_64 #1
[2950124.118093] Hardware name: Xen HVM domU, BIOS 4.2.amazon 05/06/2015
[2950124.118093] ffff88003d578ae0 ffff88003da2bc80 ffffffff814867ca ffffffff81788cf0
[2950124.118093] ffff88003da2bcf8 ffffffff814825ab ffffffff00000010 ffff88003da2bd08
[2950124.118093] ffff88003da2bca8 ffffffff81c9af20 0000000000000007 ffff88003da30480
[2950124.118093] Call Trace:
[2950124.118093] [<ffffffff814867ca>] dump_stack+0x45/0x56
[2950124.118093] [<ffffffff814825ab>] panic+0xc8/0x1cd
[2950124.118093] [<ffffffff8105ffd1>] do_exit+0xa41/0xa50
[2950124.118093] [<ffffffff8106005f>] do_group_exit+0x3f/0xa0
[2950124.118093] [<ffffffff8106f707>] get_signal_to_deliver+0x1c7/0x6e0
[2950124.118093] [<ffffffff81014458>] do_signal+0x48/0x6f0
[2950124.118093] [<ffffffff811e7c38>] ? fsnotify+0x228/0x2f0
[2950124.118093] [<ffffffff81014b68>] do_notify_resume+0x68/0x90
[2950124.118093] [<ffffffff8148d822>] retint_signal+0x48/0x86
您应该将解决方案设计为失败。失败是不可避免的,但是aws提供了所有的服务来处理问题。
在自动缩放组中设置您的 ec2 实例,以及 create/setup AWS 可以用来确定您的实例是否 运行 正常的健康检查。
如果您设置正确,当 AWS 发现您的实例是 failing/failed 时,它会自动将您的实例替换为另一个实例。
这将需要您的部分工作来正确构建事物,但是您将不再需要担心 watching/checking ou 实例并在出现问题时启动一个新实例。
http://docs.aws.amazon.com/AutoScaling/latest/DeveloperGuide/WhatIsAutoScaling.html
不要将您的 EC2 实例视为普通的托管服务提供商包,即您购买并放置您的解决方案并期望它永远 运行。如果那是您的计划,那么您最好选择正规的托管服务提供商 - 他们会通过为您管理基础 hardware/software 来确保您的网站永远 运行。
如果您要使用 AWS,请利用他们的平台。
至于您的具体问题,我倾向于认为内存泄漏 - 症状听起来不错,您一次 运行s days/weeks 重新开始,然后崩溃。
我是 运行 AWS EC2 t2.micro 实例上的一个 wordpress 页面。没什么特别的,只是一个简单的 wordpress 网站。
每隔几周就会发生这种情况:
- 我的页面将无法访问,ssh 也无法访问
- 检查仪表板时,一切正常,没有警告或投诉
- 在 AWS 管理面板上重新启动它,其中一项检查将失败:"Instance reachability check failed at (time) "
系统日志显示存在内核错误(下面复制了所有日志)。什么会导致这个? AWS 方面的硬件不好?这真的让我很困惑,请帮忙。谢谢!
[2950123.794183] end_request: I/O error, dev xvda, sector 13514688
[2950123.797618] end_request: I/O error, dev xvda, sector 13514712
[2950123.798170] end_request: I/O error, dev xvda, sector 13514776
[2950123.798170] end_request: I/O error, dev xvda, sector 13514816
[2950123.798170] end_request: I/O error, dev xvda, sector 13514872
[2950123.798170] end_request: I/O error, dev xvda, sector 12894512
[2950123.798170] end_request: I/O error, dev xvda, sector 12875536
[2950123.798170] end_request: I/O error, dev xvda, sector 511456
[2950123.798170] end_request: I/O error, dev xvda, sector 13403944
[2950123.798170] end_request: I/O error, dev xvda, sector 515968
[2950124.114201] Kernel panic - not syncing: Attempted to kill init! exitcode=0x00000007
[2950124.114201]
[2950124.118093] CPU: 0 PID: 1 Comm: init Not tainted 3.14.35-28.38.amzn1.x86_64 #1
[2950124.118093] Hardware name: Xen HVM domU, BIOS 4.2.amazon 05/06/2015
[2950124.118093] ffff88003d578ae0 ffff88003da2bc80 ffffffff814867ca ffffffff81788cf0
[2950124.118093] ffff88003da2bcf8 ffffffff814825ab ffffffff00000010 ffff88003da2bd08
[2950124.118093] ffff88003da2bca8 ffffffff81c9af20 0000000000000007 ffff88003da30480
[2950124.118093] Call Trace:
[2950124.118093] [<ffffffff814867ca>] dump_stack+0x45/0x56
[2950124.118093] [<ffffffff814825ab>] panic+0xc8/0x1cd
[2950124.118093] [<ffffffff8105ffd1>] do_exit+0xa41/0xa50
[2950124.118093] [<ffffffff8106005f>] do_group_exit+0x3f/0xa0
[2950124.118093] [<ffffffff8106f707>] get_signal_to_deliver+0x1c7/0x6e0
[2950124.118093] [<ffffffff81014458>] do_signal+0x48/0x6f0
[2950124.118093] [<ffffffff811e7c38>] ? fsnotify+0x228/0x2f0
[2950124.118093] [<ffffffff81014b68>] do_notify_resume+0x68/0x90
[2950124.118093] [<ffffffff8148d822>] retint_signal+0x48/0x86
您应该将解决方案设计为失败。失败是不可避免的,但是aws提供了所有的服务来处理问题。
在自动缩放组中设置您的 ec2 实例,以及 create/setup AWS 可以用来确定您的实例是否 运行 正常的健康检查。
如果您设置正确,当 AWS 发现您的实例是 failing/failed 时,它会自动将您的实例替换为另一个实例。
这将需要您的部分工作来正确构建事物,但是您将不再需要担心 watching/checking ou 实例并在出现问题时启动一个新实例。
http://docs.aws.amazon.com/AutoScaling/latest/DeveloperGuide/WhatIsAutoScaling.html
不要将您的 EC2 实例视为普通的托管服务提供商包,即您购买并放置您的解决方案并期望它永远 运行。如果那是您的计划,那么您最好选择正规的托管服务提供商 - 他们会通过为您管理基础 hardware/software 来确保您的网站永远 运行。
如果您要使用 AWS,请利用他们的平台。
至于您的具体问题,我倾向于认为内存泄漏 - 症状听起来不错,您一次 运行s days/weeks 重新开始,然后崩溃。