如何解码编码为 \uXXXX 的 Unicode 转义序列表情符号?
How to decode Unicode escape sequence emojis encoded as \uXXXX?
我正在尝试使用 python 对我下载的 Instagram 数据进行排序,该数据是一个 json 文件,但表情符号和其他非文本字符的编码方式我不喜欢理解,例如:
json 文件将包含:
\u00e2\u009c\u008c\u00f0\u009f\u0096\u00a4\u00f0\u009f\u008d\u0095\u00f0\u009f\u008e\u00b6\u00f0\u009f\u00a4\u00af
。
在 Instagram 应用程序上显示的是:
✌
或json:\u00e2\u0080\u0099
。 Instagram:'
(撇号)
我尝试使用 u"string"
并发现了类似的问题 here, here and here 但 none 在 python 中或向我提供任何有用的详细信息。
尝试
print(('\u00e2\u009c\u008c\u00f0\u009f\u0096\u00a4\u00f0\u009f\u008d\u0095\u00f0\u009f\u008e\u00b6\u00f0\u009f\u00a4\u00af'.encode('latin-1').decode('utf-8')))
输出:
✌
如果您在 windows 上,请按 win + 。
您会收到带有表情符号的提示
然后做
print("")
输出:
我正在尝试使用 python 对我下载的 Instagram 数据进行排序,该数据是一个 json 文件,但表情符号和其他非文本字符的编码方式我不喜欢理解,例如:
json 文件将包含:
\u00e2\u009c\u008c\u00f0\u009f\u0096\u00a4\u00f0\u009f\u008d\u0095\u00f0\u009f\u008e\u00b6\u00f0\u009f\u00a4\u00af
。
在 Instagram 应用程序上显示的是:
✌
或json:\u00e2\u0080\u0099
。 Instagram:'
(撇号)
我尝试使用 u"string"
并发现了类似的问题 here, here and here 但 none 在 python 中或向我提供任何有用的详细信息。
尝试
print(('\u00e2\u009c\u008c\u00f0\u009f\u0096\u00a4\u00f0\u009f\u008d\u0095\u00f0\u009f\u008e\u00b6\u00f0\u009f\u00a4\u00af'.encode('latin-1').decode('utf-8')))
输出:
✌
如果您在 windows 上,请按 win + 。
您会收到带有表情符号的提示
然后做
print("")
输出: