弹性云 APM 服务器 - 队列已满

Question

我在 Kubernetes 集群中有很多 Java 个微服务运行。它们都是 APM 代理，将数据发送到我们弹性云集群中的 APM 服务器。

一切正常，但突然间每个微服务都收到了日志中显示的错误。

我尝试重启集群，增加硬件功率，我尝试按照 hints 但没有成功。

Obs：磁盘几乎为空，内存使用还可以。一切都在 7.5.2 版本

Answer 1

我删除了所有与 APM 相关的索引，几分钟后一切正常。

Answer 2

for better performance u can fine tune these fields in apm-server.yml file

内部队列大小增加queue.mem.events=output.elasticsearch.worker * output.elasticsearch.bulk_max_size 默认为 4096
output.elasticsearch.worker（增加）默认为1
output.elasticsearch.bulk_max_size（增加）默认为50 非常少

Example : for my use case i have used following stats for 2 apm-server nodes and 3 es nodes (1 master 2 data nodes )

queue.mem.events=40000
output.elasticsearch.worker=4
output.elasticsearch.bulk_max_size=10000

Elastic Cloud APM Server - Queue is full