如何从解压缩的文件中删除 gzip header 元数据

How to remove the gzip header metada from decompressed file

我有一个 gzip 文件,我尝试解压并保存结果如下:

bytesReader := bytes.NewReader(gzipData)
gzipReader, err := gzip.NewReader(bytesReader)
defer gzipReader.Close()
if err == nil {
    u1 := uuid.NewV4()
    filename := u1.String() + ".json"
    file, _ := os.Create(filename)
    defer file.Close()
    fileWriter := bufio.NewWriter(file)
    io.Copy(fileWriter, gzipReader)
    fileWriter.Flush()
} else {
    log.Println(err.Error())
}

当我检查生成的 json 文件时,我看到它以一些元数据开头,如下所示:

$ head -n 1 caf12e7b-e5e5-4453-ac0f-4d1d02770632.json
data.json000644 000765 000024 00001562330 12614372206 013272 0ustar00elsoufystaff000000 000000 {... json content ...}

无论原始文件是使用 gzip data.json 还是 tar -czf data.tar.gz data.json 创建的,我都会得到这个 header。如何从写入输出文件中删除前几个字节?

您将压缩文件生成为 存档 。压缩某些东西和创建压缩存档之间的区别在于,存档是一种包含多个文件或复杂结构(例如带有文件夹的文件结构)的文件格式。

tar -cz <input files> 创建一个 archive 并使用 gzip 压缩它,因此您可以在压缩的 tar archive 中包含多个文件。

要在典型的 UNIX/Linux 环境中压缩文件,请使用 gzip 命令:

$ gzip foo.json

这将为您创建一个文件 foo.json.gz。要访问其内容,请使用 gunzipzcat:

$ zcat foo.json.gz
<contents of foo.json>

$ gunzip foo.json.gz
$ cat foo.json