AWS 弹性搜索集群变得无响应

AWS elastic search cluster becoming unresponsive

我们有几个 AWS 弹性搜索域,有时会无缘无故地停止响应。尝试加载资源几分钟后,ES 端点和 Kibana return 错误网关错误。

节点状态消息如下(没有任何帮助): /_cluster/health: {"code":"ProxyRequestServiceException","message":"Unable to execute HTTP request: Read timed out (Service: null; Status Code: 0; Error Code: null; Request ID: null)"}

集群的错误日志已激活,但未显示与集群变为非活动时间相关的任何内容。

我希望至少能够重新启动集群,但状态似乎永远保持 "processing"。

不幸的是,如果您使用的是 AWS ElasticSearch 服务(因为不是在您自己的 EC2 实例上构建它),那么很多......好吧......大部分......管理员 API 的并且功能受到限制,因此如果您从头开始构建它,您将无法深入挖掘它。

我发现 AWS Support 在需要时查明真相方面做得非常好,所以我建议您开一张支持票。

我希望情况并非如此,但是使用他们的服务既好又容易(因为您不必自己构建和维护基础设施),但是您失去了管理员或故障排除视角。 :(