如何从 gzip 档案中提取编码字典

How to extract the encoding dictionary from gzip archives

我正在寻找一种可以从 gzip 存档中提取由 DEFLATE 算法生成的编码字典的方法。

我需要 LZ77 从整个存档中生成指针,这些指针引用文件中的模式以及具有上述指针的霍夫曼树。

python有解决办法吗?

有谁知道可以提供字典的 https://github.com/madler/infgen/blob/master/infgen.c 吗?

输入中任何一点用于压缩的“字典”只不过是该点之前的 32K 字节未压缩数据。

是的,infgen 将反汇编一个 deflate 流,以可读的形式显示所有 LZ77 参考和派生的霍夫曼代码。您可以从 Python 运行 infgen 并解释 Python.

中的输出

infgen 也有一个 -b 选项,用于非人类可读的二进制格式,可能会更快地处理你想做的事情。