PyPy 与 CPython 3.8 - "number of iterations" 与相同代码的差异?

PyPy vs. CPython 3.8 - Difference in "number of iterations" with the same code?

我在修改用 Python 编写的数独求解算法时偶然发现了一个有趣的现象。

我正在计算回溯算法中的迭代次数并将次数保存在日志文件中。 (该算法似乎是完全确定性的,因此我对获得相同输出的迭代次数突然增加很感兴趣。)

现在有趣的部分是:

当我尝试 运行 使用 PyPy (3.7-v7.3.3-win32) 而不是 Python 3.8 (64bit) 的相同代码时,迭代次数大约翻了一番当 运行 PyPy 从 362073 到 629505 时 运行 CPython.

我的问题是:有谁知道为什么迭代次数会有这种差异?

日志:

Iterations: 629505, Time Taken: 0.8950409889221191, File: ./sudokus/9x9.csv  -- PyPy 3.7
Iterations: 629505, Time Taken: 0.895305871963501, File: ./sudokus/9x9.csv  -- PyPy 3.7
Iterations: 362073, Time Taken: 2.1060104370117188, File: ./sudokus/9x9.csv -- Python 3.8
Iterations: 362073, Time Taken: 2.1779544353485107, File: ./sudokus/9x9.csv -- Python 3.8

对于另一个数独文件,差异是存在的但可以忽略不计:

Iterations: 19443164, Time Taken: 106.15500068664551, File: test_0.csv -- Python 3.8
Iterations: 19443259, Time Taken: 13.188998937606812, File: ./sudokus/test_0.csv  -- PyPy 3.7
Iterations: 19443259, Time Taken: 13.118957042694092, File: ./sudokus/test_0.csv  -- PyPy 3.7

我的代码是这样的: https://github.com/kasztp/kiwi.com-sudoku-solver/blob/OCR/sudoku_solver.py

我认为您在第 117 行枚举了集合。此顺序在 CPython 中是未指定的,即任意的。在 PyPy 中,您可以获取将项目放入集合中的顺序。

我已经在两个并发调试会话中单步执行了您的代码,每个解释器一个。 self.mask 中的 set 在两个解释器之间看起来不一样——它们包含相同的值,但顺序不同。即使在 solve 的第二次递归(当 self.iterations 变为 2 时),执行流程也会因为这种差异而发生分歧。我不知道这是否是您所看到的差异的确切原因,但我猜这与 sets 在一种实现中保证插入顺序有关,而在另一种实现中则不然。