如何将字符串转换为 "gbk" 编码?

How can I convert a string to "gbk" encoding?

我正在尝试使用 Python 将一些中文单词转换为字节。例如,我有这个词:自,我试图通过这样做来转换它:

"自".encode()

但我只得到这个:

b'\xe8\x87\xaa'

在网上看,我认为它需要用“gbk”编码转换,但如果我尝试这样做,我只会得到:

b'\xd7\xd4'

我需要的是转换成这样:

\u81ea

在这里你可以看到对我正在谈论的角色的引用:https://charbase.com/81EA

\u81ea 是 unicode 代码点而不是 gbk 字节。

您可以转换为:

"自".encode("unicode_escape")
# b'\u81ea'

b'\xd7\xd4'是那个码位的gbk编码,b'\xe8\x87\xaa'是同一个码位的utf-8编码。