弹性云 APM 服务器 - 队列已满

Elastic Cloud APM Server - Queue is full

我在 Kubernetes 集群中有很多 Java 个微服务 运行。它们都是 APM 代理,将数据发送到我们弹性云集群中的 APM 服务器。

一切正常,但突然间每个微服务都收到了日志中显示的错误。

我尝试重启集群,增加硬件功率,我尝试按照 hints 但没有成功。

Obs:磁盘几乎为空,内存使用还可以。 一切都在 7.5.2 版本

我删除了所有与 APM 相关的索引,几分钟后一切正常。

for better performance u can fine tune these fields in apm-server.yml file

  1. 内部队列大小增加queue.mem.events=output.elasticsearch.worker * output.elasticsearch.bulk_max_size 默认为 4096
  2. output.elasticsearch.worker(增加)默认为1
  3. output.elasticsearch.bulk_max_size(增加)默认为50 非常少

Example : for my use case i have used following stats for 2 apm-server nodes and 3 es nodes (1 master 2 data nodes )

queue.mem.events=40000
output.elasticsearch.worker=4
output.elasticsearch.bulk_max_size=10000