使用 Windows 在 Sublime Text 控制台中打印 utf 8 字符串

Printing utf8 strings in Sublime Text's console with Windows

当运行此代码与来自Windows控制台cmd.exepython myscript.py(即Sublime Text的外部)时,它作品:

# coding: utf8
import json
d = json.loads("""{"mykey": {"readme": "Café"}}""")
print d['mykey']['readme']

Café

当 运行 在 Sublime Text 2 中使用 CTRL+B 时,它失败了:

如何在 Sublime Text 2(对于 Windows)控制台中正确 print,如果它包含一些 UTF8 字符?

注意:这 不是 的副本,我之前已经链接到这个问题了。

这是 Python.sublime-build 文件:

{ "cmd": ["python", "-u", "$file"],
"file_regex": "^[ ]*File \"(...*?)\", line ([0-9]*)",
"selector": "source.python" }

(我试过使用和不使用 "env": ...,使用和不使用 "encoding": ...

可能的快速修复:

# coding: utf8
import json
d = json.loads("""{"mykey": {"readme": "Café"}}""", encoding='latin1')
print d['mykey']['readme'].encode('latin1')

这是一个充满血腥细节的长答案,但 TL;DR 版本是这似乎是 Sublime Text 2 中的一个错误(特别是在它的 exec 命令中)。

如果升级到 Sublime Text 3 不是一个选项,下面有关于如何修补 Sublime 以潜在地解决问题的说明(它至少在我的所有测试中都有效),因为 Sublime 3 具有增强的 exec命令。


需要注意的是,您看到的错误格式为:

[Decode error - output not utf-8]

由 Sublime 在将数据添加到输出面板时生成,而不是由 Python 生成。即使有下面概述的修复,可能仍然有必要(基于系统设置 and/or 正在使用的平台)包括您问题中提到的 env 设置,因为这告诉 Python无论它认为应该做什么,都以 UTF-8 格式生成其输出。


出于以下测试的目的,我在 Windows 7 机器上安装了 Sublime Text 2 和 Python 2.7.14。这台机器上已经安装了 Python 3 并添加到 PATH,所以我按照示例构建文件中的指示将此版本安装到 C:\Python27-64 中,并将其保留在路径之外。

除了安装 PackageResourceViewer 和提高默认字体大小外,Sublime 在其他方面都很好。

测试脚本如下,根据您问题中概述的版本稍作修改:

# coding: utf8
import sys

print(sys.version)
print("Café")

因为一切都是库存,Tools > Build System 中的构建系统设置为 Automatic,并尝试 运行 使用 Ctrl+B[=85 进行构建=] 产生以下输出:

3.6.0 (v3.6.0:41df79263a11, Dec 23 2016, 08:06:12) [MSC v.1900 64 bit (AMD64)]
[Decode error - output not utf-8]
[Finished in 0.1s]

这是有道理的,因为如上所述 Python 3 在我的路径上,但 Python 2 不在,所以它选择 Python 3.

默认Python.sublime-build如下:

{
    "cmd": ["python", "-u", "$file"],
    "file_regex": "^[ ]*File \"(...*?)\", line ([0-9]*)",
    "selector": "source.python"
}

我使用 PackgeResourceViewer 打开文件并修改它以直接调用 Python 2 解释器:

{
    "cmd": ["C:\Python27-64\python.exe", "-u", "$file"],
    "file_regex": "^[ ]*File \"(...*?)\", line ([0-9]*)",
    "selector": "source.python"
}

有了这个,构建结果如下所示:

2.7.14 (v2.7.14:84471935ed, Sep 16 2017, 20:25:58) [MSC v.1500 64 bit (AMD64)]
Café
[Finished in 0.1s]

请注意,它是 运行ning Python 2,但它现在也可以正确显示数据,无需修改任何内容。

这有点奇怪,我必须承认我在这方面犯了一些错误,因为它似乎马上就能奏效。但是,如果您注释掉 sys.version:

的打印
# coding: utf8
import sys

#print(sys.version)
print("Café")

它停止工作:

[Decode error - output not utf-8]
[Decode error - output not utf-8]
[Finished in 0.1s]

或者,如果您稍微修改正在打印的文本,使其不以重音字符结尾:

# coding: utf8
import sys

# print(sys.version)
print("Café au lait")

现在它可以如您所愿地工作:

Café au lait
[Finished in 0.1s]

我认为这是 Default 包中 Sublime Text 附带的 exec 命令中的错误。特别是,它在将数据插入构建结果之前对其进行解码,因此可能对读取数据时发生缓冲区中断的位置敏感。

相反,Sublime Text 3 对 exec 命令进行了修改,该命令(除其他增强功能外)在从管道读取数据的位置使用了增量解码器,并且没有展示这一点问题。

修改 Sublime 2 中的 exec 命令以也使用增量解码似乎可以解决问题,尽管我承认我没有对此进行任何详尽的测试。

我创建了一个 public gist,其中包含 exec.py 文件的修改版本,该文件提供构建系统使用的 exec 命令,以及如何应用它的说明.

如果你使用它,你现有的构建系统(甚至是默认的)应该可以为你找到,除了我上面提到的你可能仍然需要在构建中使用 env 设置来强制Python 解释器实际输出 UTF-8,以防它不是。

我找到了一个可能的修复方法:在 Python.sublime-build 文件中添加 encoding 参数:

{
"cmd": ["python", "-u", "$file"],
"file_regex": "^[ ]*File \"(...*?)\", line ([0-9]*)",
"selector": "source.python",
"encoding": "cp1252",
...

注意:"encoding": "latin1" 似乎也可以,但是 - 我不知道为什么 - "encoding": "utf8" 不起作用,即使 .py 文件是 UTF8,即使 Python 3 使用UTF8等 谜!


编辑:现在有效:

{
  "cmd": ["python", "-u", "$file"],
  "file_regex": "^[ ]*File \"(...*?)\", line ([0-9]*)",
  "selector": "source.python",
  "encoding": "utf8",
  "env": {"PYTHONIOENCODING": "utf-8", "LANG": "en_US.UTF-8"},
}

链接主题:

  • Setting the correct encoding when piping stdout in Python and this answer 特别是

  • 用于 env 技巧。