使用 Python 将 \u2764\ufe0f 转换为 UTF-8
Convert \u2764\ufe0f to UTF-8 using Python
我从 API:
接收到 json 数据
json = {"lat": null, "body_text": "@edinburgh \u2764\ufe0f", "deduplicated_time": "2020-11-05T15:38:11.744710"}
我使用 Python 加载 json 消息。
msg_body = json.loads(msg.body,strict=False)
我使用 VaderSentiment 从 json 消息的 body_text 部分的文本中提取情绪。
问题是,当红心❤表情符号作为 \u2764\ufe0f 包含在文本 Vader 中时,无法预测正确的情绪。在他们的页面上,他们建议 vader 正在翻译 utf-8 编码的表情符号,例如 and 和 。我相信 \u2764\ufe0f 不是 UTF-8 ,如何使用 python?
将其转换为 UTF-8
如果以下页面 emoji 正确,则 \u2764\ufe0f 是“python src”编码。
这是一个 JSON 编码的 Unicode 字符。解码 JSON,例如使用 json.loads
,你会得到一个带有红心的 Python 字符串。 如果您需要将其编码为 UTF-8 编码 bytes
,请使用 str.encode
(尽管您想要使用它的库可能需要正常 Python str
s).
我从 API:
接收到 json 数据json = {"lat": null, "body_text": "@edinburgh \u2764\ufe0f", "deduplicated_time": "2020-11-05T15:38:11.744710"}
我使用 Python 加载 json 消息。
msg_body = json.loads(msg.body,strict=False)
我使用 VaderSentiment 从 json 消息的 body_text 部分的文本中提取情绪。
问题是,当红心❤表情符号作为 \u2764\ufe0f 包含在文本 Vader 中时,无法预测正确的情绪。在他们的页面上,他们建议 vader 正在翻译 utf-8 编码的表情符号,例如 and 和 。我相信 \u2764\ufe0f 不是 UTF-8 ,如何使用 python?
将其转换为 UTF-8如果以下页面 emoji 正确,则 \u2764\ufe0f 是“python src”编码。
这是一个 JSON 编码的 Unicode 字符。解码 JSON,例如使用 json.loads
,你会得到一个带有红心的 Python 字符串。 如果您需要将其编码为 UTF-8 编码 bytes
,请使用 str.encode
(尽管您想要使用它的库可能需要正常 Python str
s).