如何以人类可读的方式在嵌套对象中记录 Protobuf 字符串?

How to log Protobuf string in nested objects in a human-readable way?

给定一个原型文件:

syntax = "proto3";
package hello;

message TopGreeting {
    NestedGreeting greeting = 1;
}

message NestedGreeting {
    Greeting greeting = 1;
}

message Greeting {
    string message = 1;
}

和代码:

public class Main {
    public static void main(String[] args) {
        System.out.printf("From top: %s%n", newGreeting("오늘은 무슨 요일입니까?"));
        System.out.printf("Directly: %s%n", "오늘은 무슨 요일입니까?");
        System.out.printf("ByteString: %s", newGreeting("오늘은 무슨 요일입니까?").toByteString().toStringUtf8());
    }

    private static Hello.TopGreeting newGreeting(String message) {
        Hello.Greeting greeting = Hello.Greeting.newBuilder()
                .setMessage(message)
                .build();
        Hello.NestedGreeting nestedGreeting = Hello.NestedGreeting.newBuilder()
                .setGreeting(greeting)
                .build();
        return Hello.TopGreeting.newBuilder()
                .setGreeting(nestedGreeting)
                .build();
    }
}

输出

From top: greeting {
  greeting {
    message: "404320450 344420 424454465330214?"
  }
}

Directly: 오늘은 무슨 요일입니까?

ByteString: 
%
#
!오늘은 무슨 요일입니까?

如何以人类可读的方式打印消息?如您所见,转换为 ByteString 可以正确打印 UTF-8 字符,但也会打印一些其他垃圾 %#.

protobuf 二进制格式不是人类可读的,您不应该尝试这样做。如果需要,可以使用 JSON 变体,但坦率地说,最好记录解释后的数据,而不是有效负载。

回答我自己的问题,我通过挖掘 Protobuf 源代码解决了这个问题。

System.out.println(TextFormat.printer().escapingNonAscii(false).printToString(greeting))

输出:

greeting {
  greeting {
    message: "오늘은 무슨 요일입니까?"
  }
}

toString 使用相同的机制,但使用 escapingNonAscii(true)(省略时默认)。

另请参阅 ,了解如何将八进制序列转换为 UTF-8 字符,以防您无法访问源代码,只能访问日志。