为什么我看到 ELB 健康检查翻倍?

Why am I seeing ELB health checks doubling up?

我有一个具有以下配置的 ELB:

健康检查详情:

听众详细信息:

TCP 在端口 443 上,转发到实例端口 443,nginx 正在侦听并执行 ssl 终止。

我不断在 nginx 日志中看到双重健康检查调用。在同一时刻到来,至少是同一秒。

为什么?

在多个可用性区域 中启动的具有大量流量的 ELB,对于提供 ELB 的每个可用性区域,实际上总是至少有一个 ELB 节点处于活动状态,无论是该可用区中是否存在任何实例存在或健康。

如果您检查传入的健康检查请求的源 IP 地址,您应该会发现它们不同。特别是在启用跨区域负载平衡的情况下,您应该在每个时间间隔从 each ELB 节点看到一次健康检查,因为每个 ELB 节点都会向每个实例发送健康检查。

刚才取自我日志的例子:

Jul  1 19:22:25 localhost 172.17.0.251:4076 ELB-HealthChecker/1.0 "GET / HTTP/1.1" 
Jul  1 19:22:25 localhost 172.17.10.98:42667 ELB-HealthChecker/1.0 "GET / HTTP/1.1" 

请注意,172.17.*.* 在我的 VPC 中,这两个 IP 地址在我的两个 "public" 子网上的范围内...但它们是什么?这些是ELB节点的内部私有IP地址。

请注意,ELB "nodes" 是一个我可能会或可能不会刚刚编造的术语,但它描述了 EC2 已经无形地配置为充当弹性负载均衡器的虚拟机。 (ELB 显然部署在由 ELB 基础设施控制的 EC2 实例上,这些在您的 AWS 控制台中绝对不可见)。

您无需为这些机器单独付费,因此您通常不必关心有多少台机器。它们会随着流量负载自动扩大和缩小——轶事观察表明节点的实例 class 可能是动态的,节点数量也是如此。每个节点理论上最多可以支持与后端服务器的 64K 连接,但在您达到这样的数字之前可能会出现其他容量限制。

您可以在任何给定时间使用针对 ELB 主机名的 dig 实用程序很好地了解 ELB 集群中有多少节点,如控制台中所示。

$ dig xxxxxxxx-yyyyyyyy.us-west-2.elb.amazonaws.com

; <<>> DiG 9.8.1-P1 <<>> xxxxxxxx-yyyyyyyy.us-west-2.elb.amazonaws.com
;; global options: +cmd
;; Got answer:
;; ->>HEADER<<- opcode: QUERY, status: NOERROR, id: 38905
;; flags: qr rd ra; QUERY: 1, ANSWER: 2, AUTHORITY: 13, ADDITIONAL: 9

;; QUESTION SECTION:
;xxxxxxxx-yyyyyyyy.us-west-2.elb.amazonaws.com. IN A

;; ANSWER SECTION:
xxxxxxxx-yyyyyyyy.us-west-2.elb.amazonaws.com. 59 IN A 54.149.x.x
xxxxxxxx-yyyyyyyy.us-west-2.elb.amazonaws.com. 59 IN A 54.201.x.x

两个A-record答案大概是指两个节点。虽然 AWS 可以使用地址转换和其他网络黑客技术在单个地址后面伪装多台机器,或者在多个地址后面伪装一台机器,但观察表明,您在响应 DNS 查询时收到的答案数量可以为您提供当前的节点数量为您的 ELB 部署。