我们如何解码 python 中的表情符号和特殊字符?

How we can decode emoji,special character in python?

我有一个包含如下行的文本文件:

        Name; Country
       josué ségura;FR
       Dr Gérald KIERZEK⚡👨â€âš•ï¸;FR    #contains emoji

我需要用 UTF-8 解码这段文本,我在 python 中找不到解决方案。 我在互联网上找到 javascript 中的解决方案,但我从未使用 javascript,我需要 python 中的解决方案,它可以解码 UTF-8 中的所有文本(所有行) . 非常感谢

这是最初编码为 UTF-8 但已使用 8 位编码(可能是 cp1252 或其他一些 Windows 编码,可能是 latin-1)解码的文本。这被称为 mojibake

编码为latin-1得到字节,再解码为UTF-8即可正确解码。

> s = '33;josué ségura;FR'
>>> s.encode('latin').decode('utf-8')
'33;josué ségura;FR'