在不知道具体类型的情况下解码 gob 输出

Decode gob output without knowing concrete types

我正在使用 gob 将结构序列化到磁盘。有问题的结构包含一个接口字段,因此需要使用 gob.Register(...).

注册具体类型

这里的问题是执行 gob-ing 的库应该不知道正在使用的具体类型。我希望即使调用者定义了他们自己的接口实现也可以进行序列化。

我可以通过动态注册类型成功地对数据进行编码(参见下面的简单示例),但是在尝试重新读取该数据时,gob 拒绝接受未注册的类型。令人沮丧的是,因为感觉所有数据都在那里 - 为什么 gob 不将其作为 main.UpperCaseTransformation 结构解包,如果它被标记为这样?

package main

import (
    "encoding/gob"
    "fmt"
    "os"
    "strings"
)

type Transformation interface {
    Transform(s string) string
}

type TextTransformation struct {
    BaseString     string
    Transformation Transformation
}

type UpperCaseTransformation struct{}

func (UpperCaseTransformation) Transform(s string) string {
    return strings.ToUpper(s)
}

func panicOnError(err error) {
    if err != nil {
        panic(err)
    }
}

// Execute this twice to see the problem (it will tidy up files)
func main() {
    file := os.TempDir() + "/so-example"

    if _, err := os.Stat(file); os.IsNotExist(err) {
        tt := TextTransformation{"Hello, World!", UpperCaseTransformation{}}

        // Note: didn't need to refer to concrete type explicitly
        gob.Register(tt.Transformation)

        f, err := os.Create(file)
        panicOnError(err)

        defer f.Close()

        enc := gob.NewEncoder(f)
        err = enc.Encode(tt)
        panicOnError(err)
        fmt.Println("Run complete, run again for error.")
    } else {

        f, err := os.Open(file)
        panicOnError(err)

        defer os.Remove(f.Name())
        defer f.Close()

        var newTT TextTransformation
        dec := gob.NewDecoder(f)

        // Errors with: `gob: name not registered for interface: "main.UpperCaseTransformation"'
        err = dec.Decode(&newTT)
        panicOnError(err)
    }
}

我的解决方法是要求接口的实现者向 gob 注册他们的类型。但我不喜欢这样向调用者揭示我的序列化选择。

有没有避免这种情况的前进路线?

哲学论证

encoding/gob 包不能(或者说不应该)自己做出决定。由于 gob 包创建了一个独立于应用程序/从应用程序分离的序列化形式,因此无法保证接口类型的值将存在于解码器中;即使他们这样做(通过具体类型名称匹配),也不能保证他们代表相同的类型(或给定类型的相同实现)。

通过调用 gob.Register() (or gob.RegisterName()) 可以使 intent 明确,从而为 gob 包使用该类型开了绿灯。这也确保类型 does 存在,否则您将无法在注册时传递它的值。

技术要求

还有一个技术观点规定了此要求(您必须事先注册):您无法获得由其 string 名称给出的类型的 reflect.Type 类型描述符。不只是你,encoding/gob包也做不到。

因此,通过要求您事先调用 gob.Register()gob 包将接收到相关类型的值,因此它可以(并且将会)访问和存储其 reflect.Type 内部描述符,因此当检测到这种类型的值时,它能够创建这种类型的新值(例如使用 reflect.New()),以便将正在解码的值存储到其中。

您不能按名称 "lookup" 键入的原因是除非您明确引用它们,否则它们可能不会出现在您的二进制文件中(它们可能会 "optimized out")。有关详细信息,请参阅 ; and Splitting client/server code。注册您的自定义类型(通过传递它们的值)时,您正在对它们进行显式引用,从而确保它们不会被排除在二进制文件之外。