如何将字符串转换为 "gbk" 编码?
How can I convert a string to "gbk" encoding?
我正在尝试使用 Python 将一些中文单词转换为字节。例如,我有这个词:自,我试图通过这样做来转换它:
"自".encode()
但我只得到这个:
b'\xe8\x87\xaa'
在网上看,我认为它需要用“gbk”编码转换,但如果我尝试这样做,我只会得到:
b'\xd7\xd4'
我需要的是转换成这样:
\u81ea
在这里你可以看到对我正在谈论的角色的引用:https://charbase.com/81EA
\u81ea
是 unicode 代码点而不是 gbk 字节。
您可以转换为:
"自".encode("unicode_escape")
# b'\u81ea'
b'\xd7\xd4'
是那个码位的gbk编码,b'\xe8\x87\xaa'
是同一个码位的utf-8编码。
我正在尝试使用 Python 将一些中文单词转换为字节。例如,我有这个词:自,我试图通过这样做来转换它:
"自".encode()
但我只得到这个:
b'\xe8\x87\xaa'
在网上看,我认为它需要用“gbk”编码转换,但如果我尝试这样做,我只会得到:
b'\xd7\xd4'
我需要的是转换成这样:
\u81ea
在这里你可以看到对我正在谈论的角色的引用:https://charbase.com/81EA
\u81ea
是 unicode 代码点而不是 gbk 字节。
您可以转换为:
"自".encode("unicode_escape")
# b'\u81ea'
b'\xd7\xd4'
是那个码位的gbk编码,b'\xe8\x87\xaa'
是同一个码位的utf-8编码。