如何读取 python 中的 unicode 文件

How to read unicode file in python

我有一个制表符分隔的文件,如下所示:

col_name                    cnt
\u7834\u6653\u5fae\u660e     8
\u9ed8\u8ba4                12

我用pandas.read_excel把它们读成python,显示的是一样的。

如何读取数据并得出以下结果?谢谢!

col_name      cnt
破晓微明        8
默认           12

我正在使用 python 3.7.7 和 pandas 1.0.4

您需要使用适当的解码器对文本进行解码。对于这种情况,我们可以使用 unicode-escape。但是要解码文本,您必须先从中提取字节。

col_name = r'\u7834\u6653\u5fae\u660e'
print(bytes(col_name, 'ascii').decode('unicode-escape'))

这会给你 破晓微明

我不认为这可以在调用 pandas.read_excel 期间完成,但我不是 pandas 专家。阅读文件后,您可能需要更改列的内容。