解码 Python 中的字节

Decode bytes in Python

我用另一种语言写了一些字符串并将其保存到 xml 文件,但字符串看起来像

# A part of the xml: recipientname="Калик Мамадо.."  

tree.write(new_file_name)  # Tree is a xml (ElementTree.parse(file))

with open(new_file_name, 'r') as xml_document:
     xml = xml_document.read().replace('\n', '')

如何将它解码为普通字符串?

这些不是字节,它的超文本标记语言 https://docs.python.org/3/library/html.html

您可以使用:

import html
x = html.unescape("ад")
print(x) # This gives ---> ад

编辑,你可以在函数中传递整个文件。

那是例外。这些字符被编码,它们将被正确显示和读入。虽然您可以在文本中直接使用西里尔字母,但在写入文件时它将呈现为 unicode 实体。