我可以在 Python 中使用 pprint.pprint 后避免排序字典输出吗?

Can I avoid a sorted dictionary output after I've used pprint.pprint, in Python?

密码是:

from pprint import pprint
d = {"b" : "Maria", "c" : "Helen", "a" : "George"}
pprint(d, width = 1)

输出为:

{'a': 'George',
'b': 'Maria',
'c': 'Helen'}

但是,所需的输出是:

{'b': 'Maria',
'c': 'Helen',
'a': 'George'}

这可以用 pprint 完成还是有其他方法?

您应该使用 python 的集合库中的 OrderedDict 来保持排序不变

from collections import OrderedDict
from pprint import pprint
d = OrderedDict({"b" : "Maria", "c" : "Helen", "a" : "George"})
pprint(d, width = 1)

更新:

由于输出很重要,您可以使用以下代码,它是一个 hack,但您创建了一个函数来实现此功能:

from collections import OrderedDict
d = OrderedDict({"b" : "Maria", "c" : "Helen", "a" : "George"})
print('{', end='')
total_len = len(d)
current_index = 1
for key, value in d.items():
    print('\''+key+'\': \'' + value+ '\'', end='')
    if current_index<total_len:
        print(',')
    else:
        print('}')
    current_index += 1

如果您阅读 pprint.py 的源代码,您会发现在 PrettyPrinter._pprint_dict() 中,负责格式化字典的方法:

def _pprint_dict(self, object, stream, indent, allowance, context, level):
    write = stream.write
    write('{')
    if self._indent_per_level > 1:
        write((self._indent_per_level - 1) * ' ')
    length = len(object)
    if length:
        items = sorted(object.items(), key=_safe_tuple)
        self._format_dict_items(items, stream, indent, allowance + 1,
                                context, level)
    write('}')

_dispatch[dict.__repr__] = _pprint_dict

有这一行 items = sorted(object.items(), key=_safe_tuple),因此在处理格式化之前总是先对 dict 项目进行排序,您必须通过复制和粘贴它并在您自己的脚本中删除有问题的行来自己覆盖它:

import pprint as pp
def _pprint_dict(self, object, stream, indent, allowance, context, level):
    write = stream.write
    write('{')
    if self._indent_per_level > 1:
        write((self._indent_per_level - 1) * ' ')
    length = len(object)
    if length:
        self._format_dict_items(object.items(), stream, indent, allowance + 1,
                                context, level)
    write('}')
pp.PrettyPrinter._dispatch[dict.__repr__] = _pprint_dict

这样:

pp.pprint({"b" : "Maria", "c" : "Helen", "a" : "George"}, width=1)

将输出(在 Python 3.6+ 中):

{'b': 'Maria',
 'c': 'Helen',
 'a': 'George'}

Python 3.8 或更新版本:

您可以使用 sort_dicts=False 来防止它按字母顺序对它们进行排序:

pprint.pprint(data, sort_dicts=False)

Python 3.7 或更早版本:

自 Python 3.7(或 cPython 情况下的 3.6),dict 保留插入顺序。对于之前的任何版本,您将需要使用 OrderedDict 来保持密钥的顺序。

虽然,来自 doc on pprint

Dictionaries are sorted by key before the display is computed.

这意味着 pprint 无论如何都会中断您想要的订单。

替代方法:

您还可以使用 json.dumps 来漂亮地打印您的数据。

代码:

import json
from collections import OrderedDict

# For Python 3.6 and prior, use an OrderedDict
d = OrderedDict(b="Maria", c="Helen", a="George")

print(json.dumps(d, indent=1))

输出:

{
 "b": "Maria",
 "c": "Helen",
 "a": "George"
}

一个更通用的解决方案是使用 unittest.mock.patch 覆盖内置的 sorted 函数,该函数只 return 给定的第一个参数:

import pprint
from unittest.mock import patch

def unsorted_pprint(*args, **kwargs):
    with patch('builtins.sorted', new=lambda l, **_: l):
        orig_pprint(*args, **kwargs)

orig_pprint = pprint.pprint
pprint.pprint = unsorted_pprint

这样:

pprint.pprint({"b" : "Maria", "c" : "Helen", "a" : "George"})

输出:

{'b': 'Maria', 'c': 'Helen', 'a': 'George'}

从 Python 3.8 开始,pprint 有一个 sort_dicts 关键字参数,您可以设置它以防止它按字母顺序对字典键进行排序。如果将其设置为 false,它将使用字典的默认顺序(例如插入顺序)。

示例:

>>> from pprint import pprint
>>> pprint(dict(z=0, a=1), sort_dicts=False)
{'z': 0, 'a': 1}