表示编码字符的字符串
A string that represents encoded characters
我使用 python 2.7,我有以下字符串:mystr = '\xde\x05\xd7\x05\xe9\x05\xd1\x05'
我想从中获取真正的 unicode 字符串:myuni = u'\u05de\u05d7\u05e9\u05d1'
。
编码为"cp1255".
我该如何完成?
谢谢!
您没有CP1255数据。您使用的是 UTF-16(小端)数据:
>>> mystr = '\xde\x05\xd7\x05\xe9\x05\xd1\x05'
>>> mystr.decode('utf-16-le')
u'\u05de\u05d7\u05e9\u05d1'
CP1255 长这样:
>>> u'\u05de\u05d7\u05e9\u05d1'.encode('cp1255')
'\xee\xe7\xf9\xe1'
我使用 python 2.7,我有以下字符串:mystr = '\xde\x05\xd7\x05\xe9\x05\xd1\x05'
我想从中获取真正的 unicode 字符串:myuni = u'\u05de\u05d7\u05e9\u05d1'
。
编码为"cp1255".
我该如何完成?
谢谢!
您没有CP1255数据。您使用的是 UTF-16(小端)数据:
>>> mystr = '\xde\x05\xd7\x05\xe9\x05\xd1\x05'
>>> mystr.decode('utf-16-le')
u'\u05de\u05d7\u05e9\u05d1'
CP1255 长这样:
>>> u'\u05de\u05d7\u05e9\u05d1'.encode('cp1255')
'\xee\xe7\xf9\xe1'