PyPy 与 CPython 3.8 - "number of iterations" 与相同代码的差异？

Question

我在修改用 Python 编写的数独求解算法时偶然发现了一个有趣的现象。

我正在计算回溯算法中的迭代次数并将次数保存在日志文件中。（该算法似乎是完全确定性的，因此我对获得相同输出的迭代次数突然增加很感兴趣。）

现在有趣的部分是：

当我尝试运行使用 PyPy (3.7-v7.3.3-win32) 而不是 Python 3.8 (64bit) 的相同代码时，迭代次数大约翻了一番当运行 PyPy 从 362073 到 629505 时运行 CPython.

我的问题是：有谁知道为什么迭代次数会有这种差异？

日志：

Iterations: 629505, Time Taken: 0.8950409889221191, File: ./sudokus/9x9.csv  -- PyPy 3.7
Iterations: 629505, Time Taken: 0.895305871963501, File: ./sudokus/9x9.csv  -- PyPy 3.7
Iterations: 362073, Time Taken: 2.1060104370117188, File: ./sudokus/9x9.csv -- Python 3.8
Iterations: 362073, Time Taken: 2.1779544353485107, File: ./sudokus/9x9.csv -- Python 3.8

对于另一个数独文件，差异是存在的但可以忽略不计：

Iterations: 19443164, Time Taken: 106.15500068664551, File: test_0.csv -- Python 3.8
Iterations: 19443259, Time Taken: 13.188998937606812, File: ./sudokus/test_0.csv  -- PyPy 3.7
Iterations: 19443259, Time Taken: 13.118957042694092, File: ./sudokus/test_0.csv  -- PyPy 3.7

我的代码是这样的： https://github.com/kasztp/kiwi.com-sudoku-solver/blob/OCR/sudoku_solver.py

Answer 1

我认为您在第 117 行枚举了集合。此顺序在 CPython 中是未指定的，即任意的。在 PyPy 中，您可以获取将项目放入集合中的顺序。

Answer 2

我已经在两个并发调试会话中单步执行了您的代码，每个解释器一个。 self.mask 中的 set 在两个解释器之间看起来不一样——它们包含相同的值，但顺序不同。即使在 solve 的第二次递归（当 self.iterations 变为 2 时），执行流程也会因为这种差异而发生分歧。我不知道这是否是您所看到的差异的确切原因，但我猜这与 sets 在一种实现中保证插入顺序有关，而在另一种实现中则不然。

PyPy 与 CPython 3.8 - "number of iterations" 与相同代码的差异？

PyPy vs. CPython 3.8 - Difference in "number of iterations" with the same code?

python

algorithm

loops

pypy

sudoku