使用 C/C++ 查找无效的 bz2 文件更可取

Find invalid bz2 file preferable using C/C++

我有大约 20 万个 bz2 文件,其中只有一个 1 有效。每个 bz2 文件的大小小于 200 字节。我需要找到有效的。命令行 bz2 实用程序花费了太多时间。

是否有使用文件字节的最小检查,通过它我可以找到无效的 bz2 并忽略进一步处理。我想在 C/C++ 中做,因为它比 shell 脚本快得多。

得到解决方案。按照 bz2 格式,前 3 个字符应该是 'BZh'。这过滤掉了除 19 个文件之外的所有文件。