python unicode contains '\u000A' 转换成中文错误
python unicode contains '\u000A' convert make Chinese error
我想把这个字串转成正确的字串,如何把\uOOOA
转成'\n'而不打错中文码
# string
s = u'蛋疼\u000A egg烦'
我试过了
s.encode('utf-8').decode('unicode-escape')
这更正了 \u000A
,但将中文文本变成了不可读的乱码:
èç¼
eggç¦
我从 HTML 页面的 Javascript 代码中获取了字符串。
unicode-escape
首先将未转义的字节解码为 Latin-1。对于 Javascript 数据使用也是错误的方法; Python 和 Javascript 语法略有不同,在某些极端情况下您会得到错误的结果。
相反,将数据视为 JSON。 Javascript 字符串始终可以被视为 JSON 字符串类型,前提是您保留引号:
s = u'"蛋疼\u000A egg烦"'
请注意,该字符串现在以 "
和 "
开头和结尾。 HTML 页面中的原始 Javascript 字符串定义也可以。
当您从 HTML 页面提取数据时,保留 双引号,然后将其传递给 json.loads()
:
>>> import json
>>> s = u'"蛋疼\u000A egg烦"'
>>> json.loads(s)
u'\u86cb\u75bc\n egg\u70e6'
>>> print json.loads(s)
蛋疼
egg烦
通过示例学习:
==> python
Python 3.5.1 (v3.5.1:37a07cee5969, Dec 6 2015, 01:54:25) [MSC v.1900 64 bit (AMD64)] on win32
Type "help", "copyright", "credits" or "license" for more information.
>>>
>>> # original
...
>>> s= u'蛋疼\u000A egg烦'
>>> s
'蛋疼\u000A egg烦'
>>> print(s)
蛋疼\u000A egg烦
>>>
>>>
>>> # answer
...
>>> s= u'蛋疼\u000A egg烦'
>>> s
'蛋疼\n egg烦'
>>> print(s)
蛋疼
egg烦
>>>
我想把这个字串转成正确的字串,如何把\uOOOA
转成'\n'而不打错中文码
# string
s = u'蛋疼\u000A egg烦'
我试过了
s.encode('utf-8').decode('unicode-escape')
这更正了 \u000A
,但将中文文本变成了不可读的乱码:
èç¼
eggç¦
我从 HTML 页面的 Javascript 代码中获取了字符串。
unicode-escape
首先将未转义的字节解码为 Latin-1。对于 Javascript 数据使用也是错误的方法; Python 和 Javascript 语法略有不同,在某些极端情况下您会得到错误的结果。
相反,将数据视为 JSON。 Javascript 字符串始终可以被视为 JSON 字符串类型,前提是您保留引号:
s = u'"蛋疼\u000A egg烦"'
请注意,该字符串现在以 "
和 "
开头和结尾。 HTML 页面中的原始 Javascript 字符串定义也可以。
当您从 HTML 页面提取数据时,保留 双引号,然后将其传递给 json.loads()
:
>>> import json
>>> s = u'"蛋疼\u000A egg烦"'
>>> json.loads(s)
u'\u86cb\u75bc\n egg\u70e6'
>>> print json.loads(s)
蛋疼
egg烦
通过示例学习:
==> python
Python 3.5.1 (v3.5.1:37a07cee5969, Dec 6 2015, 01:54:25) [MSC v.1900 64 bit (AMD64)] on win32
Type "help", "copyright", "credits" or "license" for more information.
>>>
>>> # original
...
>>> s= u'蛋疼\u000A egg烦'
>>> s
'蛋疼\u000A egg烦'
>>> print(s)
蛋疼\u000A egg烦
>>>
>>>
>>> # answer
...
>>> s= u'蛋疼\u000A egg烦'
>>> s
'蛋疼\n egg烦'
>>> print(s)
蛋疼
egg烦
>>>