kafka compression-rate-avg 是什么意思

What does mean kafka compression-rate-avg

我是 运行 Kafka 生产者,正在查看指标: 平均压缩率

该值是什么意思 - 值越高压缩越好,反之亦然?

我目前的压缩策略是gzip,producer buffer memory是32Mb。每条消息是 0.5-1M 未压缩 推荐的压缩配置是什么?

来自 documentation(总是一个好的起点):

compression-rate-avg

The average compression rate of record batches, defined as the average ratio of the compressed batch size over the uncompressed size.

越小越好。

至于使用哪个,请参阅 https://developer.ibm.com/articles/benefits-compression-kafka-messaging/(又花了 30 秒的谷歌搜索才找到)。它有这个 table:

我觉得 Zstd 不错。