deflate 是否很好地压缩了紧密交错的可压缩和不可压缩数据?

Does deflate compress tightly interleaved compressible and non-compressible data well?

假设我有一个可重复的模式,例如 4 个随机字节的随机数据、4 个可预测字节、4 个新的随机字节、相同的 4 个可预测字节,等等。这是放气可以很好压缩的东西吗?

是不是4个字节太短了压缩不好?
deflate 是否内置了对这样的交错 compressible/non-compressible 数据的支持?
有没有其他常见的压缩格式能更好地处理这种模式?

您必须定义 "well",但是是的,deflate 可以而且将会利用短至三个字节的重复字符串。

没有比试一试更好的了。我生成了 100,000 组四个随机字节后跟四个零,所以总共 800,000 个字节。 gzip 将其压缩到大约 500,000 字节。这还不错,因为它肯定不能超过 400,000,这是随机数据的大小。