如何在 python 中解码此字符串?
How can I decode this string in python?
我下载了一个 facebook 消息数据集,它的格式如下:
f\u00c3\u00b8rste student
它应该是 første student
但我似乎无法正确解码它。
我试过了:
str = 'f\u00c3\u00b8rste student'
print(str)
# 'første student'
str = 'f\u00c3\u00b8rste student'
print(str.encode('utf-8'))
# b'f\xc3\x83\xc2\xb8rste student'
但是没有用。
要撤消发生的任何编码错误,您首先需要通过在 ISO-8859-1 (Latin-1) 中编码将字符转换为具有相同序数的字节,然后再解码为 UTF-8 :
>>> 'f\u00c3\u00b8rste student'.encode('iso-8859-1').decode('utf-8')
'første student'
我下载了一个 facebook 消息数据集,它的格式如下:
f\u00c3\u00b8rste student
它应该是 første student
但我似乎无法正确解码它。
我试过了:
str = 'f\u00c3\u00b8rste student'
print(str)
# 'første student'
str = 'f\u00c3\u00b8rste student'
print(str.encode('utf-8'))
# b'f\xc3\x83\xc2\xb8rste student'
但是没有用。
要撤消发生的任何编码错误,您首先需要通过在 ISO-8859-1 (Latin-1) 中编码将字符转换为具有相同序数的字节,然后再解码为 UTF-8 :
>>> 'f\u00c3\u00b8rste student'.encode('iso-8859-1').decode('utf-8')
'første student'