Windows 非英文和英文字符的XP编码

Question

问题：

我正在使用 python 和 cp1253 编码编写一个包含希腊字符的 txt 文件，但程序在某些字符处抛出错误。

UnicodeEncodeError: 'charmap' codec can't encode character '\u2265' in position 389: character maps to <undefined>

问题：

我相信如果我使用包含两种语言并与 Windows XP 兼容的编码，这个问题可以得到解决。所以我的问题是：

Windows XP 如何处理双语文本？它使用“混合”编码吗？

编辑几个月后我回来了，我意识到我的问题是多么天真。不管怎样，我几乎保持不变，我会为有同样问题的新开发者回答这个问题

Answer 1

显然，问题是我尝试编写的文本包含编码中未包含的字符。

为了解决这个问题，我尝试用正常字符替换所有“坏”字符。为了找到所有这些字符，我使用了以下脚本

bad_chars = []
with open(name, 'w', encoding = 'cp1253') as res:
    for i in range(len(whole_text)):
        try:
            res.write(whole_text[i])
        except:
            bad_chars.append(whole_text[i])

然后我用正确的字符创建了一个字典，并在文本中替换了它们。

chars_to_change = {'∆':'Δ', 'Ω':'Ω', '₂':'2'}
for c1, c2 in chars_to_change.items():
    whole_text = whole_text.replace(c1, c2)

请注意，可能会有更好的解决方案，尤其是在解决方案的第一部分。如果您发现改进或错误，请编辑

Windows 非英文和英文字符的XP编码

Windows XP encoding for non-english and english characters

python

encoding

windows-xp