反序列化 json 与 serde 通过数值作为类型标识符

Deserialization of json with serde by a numerical value as type identifier

我对 rust 很陌生,并且有 OOP 背景。所以,也许我误解了一些生锈的基础知识。

我想用 serde 解析一个固定的 json-结构。此结构表示一种不同的消息类型。每条消息都有一个数字 type 属性来区分它。各个消息类型的确切结构大部分不同,但它们也可以相同。

{"type": 1, "sender_id": 4, "name": "sender", ...}
{"type": 2, "sender_id": 5, "measurement": 3.1415, ...}
{"type": 3, "sender_id": 6, "measurement": 13.37, ...}
...

首先,我定义了一个 enum 来区分消息类型,还为每种类型的消息定义了一个 struct,没有存储类型的字段。

#[derive(Debug, Serialize, Deserialize)]
#[serde(tag = "type")]
enum Message {
    T1(Type1),
    T2(Type2),
    T3(Type3),
    // ...
}

#[derive(Debug, Serialize, Deserialize)]
struct Type1 {
    sender_id: u32,
    name: String,
    // ...
}
#[derive(Debug, Serialize, Deserialize)]
struct Type2 {
    sender_id: u32,
    measurement: f64,
    // ...
}
#[derive(Debug, Serialize, Deserialize)]
struct Type3 {
    sender_id: u32,
    measurement: f64,
    // ...
}
// ...

当我尝试将字符串转换为 Message 对象时,出现错误。

let message = r#"{"type":1,"sender_id":123456789,"name":"sender"}"#;
let message: Message = serde_json::from_str(message)?; // error here
// Error: Custom { kind: InvalidData, error: Error("invalid type: integer `1`, expected variant identifier", line: 1, column: 9) }

因此,据我了解,serde 试图找出当前消息的类型,但它需要一个字符串 为了那个原因。我还尝试编写自己的 deserialize() 函数。我试图获得数值 相应的 type-key 并希望通过类型值创建特定对象。

我如何实现 deserialize() 来提取消息类型并创建特定的消息对象?是否可以在不为每个 Type1/2/3/... 结构编写 deserialize() 函数的情况下编写此代码?

impl<'de> Deserialize<'de> for Message {
fn deserialize<D>(deserializer: D) -> Result<Self, D::Error>
                  where D: Deserializer<'de>,
{
    // which functions I have to call?
}

或者有没有更好的方案来实现我的反序列化?

我为这个问题准备了一个游乐场:Playground

Serde 尚不支持整数标签(参见 issue #745)。


如果您能够更改生成数据的内容,那么如果您能够将 type 更改为字符串,即 "1" 而不是 1。然后你可以简单地使用 #[serde(rename)].

让它工作
#[derive(Debug, Serialize, Deserialize)]
#[serde(tag = "type")]
enum Message {
    #[serde(rename = "1")]
    T1(Type1),
    #[serde(rename = "2")]
    T2(Type2),
    #[serde(rename = "3")]
    T3(Type3),
    // ...
}

如果这不是一个选项,那么您确实需要创建一个自定义反序列化器。最短的代码来讲,很可能反序列化成serde_json::Value,然后匹配上type,而反序列化serde_json::Value正确 Type{1,2,3}.

use serde_json::Value;

impl<'de> serde::Deserialize<'de> for Message {
    fn deserialize<D: serde::Deserializer<'de>>(d: D) -> Result<Self, D::Error> {
        let value = Value::deserialize(d)?;

        Ok(match value.get("type").and_then(Value::as_u64).unwrap() {
            1 => Message::T1(Type1::deserialize(value).unwrap()),
            2 => Message::T2(Type2::deserialize(value).unwrap()),
            3 => Message::T3(Type3::deserialize(value).unwrap()),
            type_ => panic!("unsupported type {:?}", type_),
        })
    }
}

您可能想要执行一些适当的 error handling,而不是解包和恐慌。


如果您也需要序列化,那么您同样需要一个自定义序列化程序。为此,您可以创建一个新类型来序列化,因为您不能使用 Message.

use serde::Serializer;

impl Serialize for Message {
    fn serialize<S>(&self, serializer: S) -> Result<S::Ok, S::Error>
    where
        S: Serializer,
    {
        #[derive(Serialize)]
        #[serde(untagged)]
        enum Message_<'a> {
            T1(&'a Type1),
            T2(&'a Type2),
            T3(&'a Type3),
        }

        #[derive(Serialize)]
        struct TypedMessage<'a> {
            #[serde(rename = "type")]
            t: u64,
            #[serde(flatten)]
            msg: Message_<'a>,
        }

        let msg = match self {
            Message::T1(t) => TypedMessage { t: 1, msg: Message_::T1(t) },
            Message::T2(t) => TypedMessage { t: 2, msg: Message_::T2(t) },
            Message::T3(t) => TypedMessage { t: 3, msg: Message_::T3(t) },
        };
        msg.serialize(serializer)
    }
}

当使用 #[serde(flatten)], then it uses serde::private::ser::FlatMapSerializer, which is hidden from the documentation. In place of creating new types, you could use SerializeMapFlatMapSerializer 时。

但是,请注意,鉴于它没有记录,如果您直接使用 FlatMapSerializer,任何未来版本的 serde 都可能 破坏您的代码。

use serde::{private::ser::FlatMapSerializer, ser::SerializeMap, Serializer};

impl Serialize for Message {
    fn serialize<S>(&self, serializer: S) -> Result<S::Ok, S::Error>
    where
        S: Serializer,
    {
        let mut s = serializer.serialize_map(None)?;

        let type_ = &match self {
            Message::T1(_) => 1,
            Message::T2(_) => 2,
            Message::T3(_) => 3,
        };
        s.serialize_entry("type", &type_)?;

        match self {
            Message::T1(t) => t.serialize(FlatMapSerializer(&mut s))?,
            Message::T2(t) => t.serialize(FlatMapSerializer(&mut s))?,
            Message::T3(t) => t.serialize(FlatMapSerializer(&mut s))?,
        }

        s.end()
    }
}