小字符串列表的良好字符串压缩 algorithms/approaches?
Good string compression algorithms/approaches for list of small strings?
我有一个小字符串列表,我想快速压缩它们。这样做的好方法是什么?这些字符串没有任何其他属性,除了有大约 1300 万个长度为 5 - 30 个字符的字符串。
更新:看评论,这些都是网络发的,用于join所以不知道具体属性,顺序无所谓,我是批量发的。
根据您的评论,您不需要能够解压缩个人 small string
。
在使用您最容易使用的标准 compression/decompression 方法之前对字符串进行排序应该会有很长的路要走。
衡量效果差异,欢迎举报!
as compressed as possible
和 "optimisation".
一样危险
预先确定一个目标,并从足够好中判断不存在,并在实现后继续前进.
我有一个小字符串列表,我想快速压缩它们。这样做的好方法是什么?这些字符串没有任何其他属性,除了有大约 1300 万个长度为 5 - 30 个字符的字符串。
更新:看评论,这些都是网络发的,用于join所以不知道具体属性,顺序无所谓,我是批量发的。
根据您的评论,您不需要能够解压缩个人 small string
。
在使用您最容易使用的标准 compression/decompression 方法之前对字符串进行排序应该会有很长的路要走。
衡量效果差异,欢迎举报!
as compressed as possible
和 "optimisation".
一样危险
预先确定一个目标,并从足够好中判断不存在,并在实现后继续前进.