将 "weird" 个字符串转换为普通的 python 个字符串
Convert "weird" strings to normal python strings
上下文:我正在尝试转换如下字符:
到正常的 python 字符串(speedy、building、tuesday 等)并将它们保存到一个新的数据框中,以便导出到一个新的 excel 文件中。例如,字符 (U+1D552) 应转换为 (U+00AA)。我正在使用 read_excel
从 excel 文件中读取每个字符串。我应该做某种类型的编码=“utf-8”吗?在 read_excel 函数上?或者有没有办法使用 re
来替换这些字符?甚至编码(“ascii”)。解码(utf-8)?
提前致谢
使用unicodedata
你可以标准化unicode字符串:
>> from unicodedata import normalize
>> test_str = " "
>> print(normalize('NFKC', test_str))
BUILDING Speedy TUESDAY spaghetti
上下文:我正在尝试转换如下字符:
到正常的 python 字符串(speedy、building、tuesday 等)并将它们保存到一个新的数据框中,以便导出到一个新的 excel 文件中。例如,字符 (U+1D552) 应转换为 (U+00AA)。我正在使用 read_excel
从 excel 文件中读取每个字符串。我应该做某种类型的编码=“utf-8”吗?在 read_excel 函数上?或者有没有办法使用 re
来替换这些字符?甚至编码(“ascii”)。解码(utf-8)?
提前致谢
使用unicodedata
你可以标准化unicode字符串:
>> from unicodedata import normalize
>> test_str = " "
>> print(normalize('NFKC', test_str))
BUILDING Speedy TUESDAY spaghetti