如何读取 python 中的 unicode 文件
How to read unicode file in python
我有一个制表符分隔的文件,如下所示:
col_name cnt
\u7834\u6653\u5fae\u660e 8
\u9ed8\u8ba4 12
我用pandas.read_excel把它们读成python,显示的是一样的。
如何读取数据并得出以下结果?谢谢!
col_name cnt
破晓微明 8
默认 12
我正在使用 python 3.7.7 和 pandas 1.0.4
您需要使用适当的解码器对文本进行解码。对于这种情况,我们可以使用 unicode-escape
。但是要解码文本,您必须先从中提取字节。
col_name = r'\u7834\u6653\u5fae\u660e'
print(bytes(col_name, 'ascii').decode('unicode-escape'))
这会给你 破晓微明
。
我不认为这可以在调用 pandas.read_excel
期间完成,但我不是 pandas
专家。阅读文件后,您可能需要更改列的内容。
我有一个制表符分隔的文件,如下所示:
col_name cnt
\u7834\u6653\u5fae\u660e 8
\u9ed8\u8ba4 12
我用pandas.read_excel把它们读成python,显示的是一样的。
如何读取数据并得出以下结果?谢谢!
col_name cnt
破晓微明 8
默认 12
我正在使用 python 3.7.7 和 pandas 1.0.4
您需要使用适当的解码器对文本进行解码。对于这种情况,我们可以使用 unicode-escape
。但是要解码文本,您必须先从中提取字节。
col_name = r'\u7834\u6653\u5fae\u660e'
print(bytes(col_name, 'ascii').decode('unicode-escape'))
这会给你 破晓微明
。
我不认为这可以在调用 pandas.read_excel
期间完成,但我不是 pandas
专家。阅读文件后,您可能需要更改列的内容。