弹性云 APM 服务器 - 队列已满
Elastic Cloud APM Server - Queue is full
我在 Kubernetes 集群中有很多 Java 个微服务 运行。它们都是 APM 代理,将数据发送到我们弹性云集群中的 APM 服务器。
一切正常,但突然间每个微服务都收到了日志中显示的错误。
我尝试重启集群,增加硬件功率,我尝试按照 hints 但没有成功。
Obs:磁盘几乎为空,内存使用还可以。
一切都在 7.5.2 版本
我删除了所有与 APM 相关的索引,几分钟后一切正常。
for better performance u can fine tune these fields in apm-server.yml file
- 内部队列大小增加
queue.mem.events=output.elasticsearch.worker * output.elasticsearch.bulk_max_size
默认为 4096
- output.elasticsearch.worker(增加)默认为1
- output.elasticsearch.bulk_max_size(增加)默认为50 非常少
Example : for my use case i have used following stats for 2 apm-server nodes and 3 es nodes (1 master 2 data nodes )
queue.mem.events=40000
output.elasticsearch.worker=4
output.elasticsearch.bulk_max_size=10000
我在 Kubernetes 集群中有很多 Java 个微服务 运行。它们都是 APM 代理,将数据发送到我们弹性云集群中的 APM 服务器。
一切正常,但突然间每个微服务都收到了日志中显示的错误。
我尝试重启集群,增加硬件功率,我尝试按照 hints 但没有成功。
Obs:磁盘几乎为空,内存使用还可以。 一切都在 7.5.2 版本
我删除了所有与 APM 相关的索引,几分钟后一切正常。
for better performance u can fine tune these fields in apm-server.yml file
- 内部队列大小增加
queue.mem.events=output.elasticsearch.worker * output.elasticsearch.bulk_max_size
默认为 4096 - output.elasticsearch.worker(增加)默认为1
- output.elasticsearch.bulk_max_size(增加)默认为50 非常少
Example : for my use case i have used following stats for 2 apm-server nodes and 3 es nodes (1 master 2 data nodes )
queue.mem.events=40000
output.elasticsearch.worker=4
output.elasticsearch.bulk_max_size=10000