使用 UTF-8 解码字节
Decode byte with UTF-8
我目前正在查询一个 kdb 系统,它以字节为单位返回数据。特别是在一栏中,我得到一个看起来像这样的字节对象
b'US $ to UK \xa3 (TTF)'
如果我想解码它的字符串版本,我可以执行以下操作并且有效:
result = 'US $ to UK \xa3 (TTF)'.encode().decode()
但是我想不出解码字节对象的方法,有什么建议吗?
我试过了
b'US $ to UK \xa3 (TTF)'.decode()
但这给出了一个例外,因为 \xa3 尚未编码,有没有办法将此字节对象转换为字符串文字而不解码?
该字符串的编码似乎是 ISO-8859-1 (a.k.a.Latin-1),而不是 UTF-8。正确解码字符串后,您将能够使用它或将其编码为 UTF-8 等其他编码。
raw = b'US $ to UK \xa3 (TTF)'
text = raw.decode('ISO-8859-1')
我目前正在查询一个 kdb 系统,它以字节为单位返回数据。特别是在一栏中,我得到一个看起来像这样的字节对象
b'US $ to UK \xa3 (TTF)'
如果我想解码它的字符串版本,我可以执行以下操作并且有效:
result = 'US $ to UK \xa3 (TTF)'.encode().decode()
但是我想不出解码字节对象的方法,有什么建议吗?
我试过了
b'US $ to UK \xa3 (TTF)'.decode()
但这给出了一个例外,因为 \xa3 尚未编码,有没有办法将此字节对象转换为字符串文字而不解码?
该字符串的编码似乎是 ISO-8859-1 (a.k.a.Latin-1),而不是 UTF-8。正确解码字符串后,您将能够使用它或将其编码为 UTF-8 等其他编码。
raw = b'US $ to UK \xa3 (TTF)'
text = raw.decode('ISO-8859-1')