小字符串列表的良好字符串压缩 algorithms/approaches?

Good string compression algorithms/approaches for list of small strings?

我有一个小字符串列表,我想快速压缩它们。这样做的好方法是什么?这些字符串没有任何其他属性,除了有大约 1300 万个长度为 5 - 30 个字符的字符串。

更新:看评论,这些都是网络发的,用于join所以不知道具体属性,顺序无所谓,我是批量发的。

根据您的评论,您不需要能够解压缩个人 small string
在使用您最容易使用的标准 compression/decompression 方法之前对字符串进行排序应该会有很长的路要走。
衡量效果差异,欢迎举报!

as compressed as possible 和 "optimisation".
一样危险 预先确定一个目标,并从足够好中判断不存在,并在实现后继续前进.