LZW、LZ77等易于实现的算法的压缩比

Compression ratio of LZW, LZ77 and other easy-to-implement algorithms

我想压缩 .txt 个文件,其中包含 yyyy-mm-dd hh:mm:ss 格式的日期和有时会在不同行中重复的英文单词。
我阅读了一些关于压缩算法的文章,发现在我的例子中,基于字典的编码比基于熵的编码更好。因为我想自己实现算法,所以我需要一些不是很复杂的东西。所以我关注了LZW和LZ77,但无法在两者之间做出选择,因为我找到的文章结论是矛盾的。根据一些文章,LZW 具有更好的压缩比,而根据其他文章,领导者是 LZ77。所以问题是在我的情况下哪个最有可能更好?是否有更易于实现的算法可以满足我的目的?

LZW 已过时。现代的,甚至相当古老的 LZ77 压缩机优于 LZW。

无论如何,只有您能回答您的问题,因为只有您有要压缩的数据示例。只需在您的数据上试验各种压缩方法(zstd、xz、lz4 等),看看哪种压缩率和速度组合可以满足您的需求。