奇怪的 Python 模逆加速
Strange Python Speedup for Modular Inverse
平时比较懒,模逆计算如下:
def inv(a,m):
return 1 if a==1 else ((a-inv(m%a,a))*m+1)//a
print(inv(100**7000,99**7001))
但我很想知道传递更多信息的方法,即 Bezout 定理的解决方案(而不是一对定理中的一个),在实践中是否会产生更快或更慢的算法:
def bez(a,b):
# returns [x,y,d] where a*x+b*y = d = gcd(a,b) since (b%a)*y+a*(x+(b//a)*y)=d
if a==0: return [0,1,b] if b>0 else [0,-1,-b]
r=bez(b%a,a)
return [r[1]-(b//a)*r[0],r[0],r[2]]
def inv(a,m):
r=bez(a,m)
if r[2]!=1: return None
return r[0] if r[0]>=0 else r[0]+abs(m)
print(inv(100**7000,99**7001))
我惊奇地发现,后者运行比前者快了50多倍!但是两者都使用几乎相同数量的递归调用和每次调用 1 个整数除法和 1 个模运算,并且 ope运行ds 的位长平均大约是前者的两倍(因为涉及的参数相同), 所以我只期望它的时间复杂度大约是后者的4倍,而不是50倍。
So why am I observing this strange speedup?
请注意,我使用的是 Python 3,我在 运行 online 时观察到这一点,并在顶部添加了以下代码以停止 Python 解释器抱怨超过最大递归深度或堆栈 space:
import resource,sys
sys.setrecursionlimit(1000000)
resource.setrlimit(resource.RLIMIT_STACK,[0x10000000,resource.RLIM_INFINITY])
我终于明白了。假设初始输入是 n 位整数。在典型情况下,除了第一次调用 inv
或 inv2
之外,递归调用的参数大小平均仅相差 O(1),并且平均有 O(n) 次递归调用,两者都是由于一些数论现象。这种 O(1) 大小差异意味着这两种方法实际上具有截然不同的平均时间复杂度。我的问题中隐含的假设是两个 n 位整数的乘法或除法大约需要 O(n^2) 时间;这适用于最坏的情况(对于教科书乘法),但不适用于快速方法的平均情况!
对于fast方法,可以证明当p,q > 0时,bez(p,q)
返回的三元组[x,y,d]满足abs(x) ≤ q和abs(y) ≤ p。因此,当每个调用 bez(a,b)
执行 b%a
和 (b//a)*r[0]
时,模、除法和乘法平均需要 O(size(a)) 时间,因为 size(b)-size(a ) ∈ O(1) 平均且 abs(r[0]) ≤ a。因此总时间大约为 O(n^2).
然而,对于慢速方法,当每次调用 inv(a,m)
执行 ((a-inv(m%a,a))*m+1)//a
时,我们有 a-inv(m%a,a) 与 a 的大小大致相同,因此此除法是两个整数,其中第一个大约是第二个的两倍,这将花费 O(size(a)^2) 时间!因此总时间大约为 O(n^3).
的确,模拟结果与上述分析非常吻合。作为参考,使用快速方法 inv(100**n,99**(n+1))
where n = 1400·k for k∈[1..6] take time/ms 17,57,107,182,281,366
,而使用 slow method where n = 500· k 为 k∈[1..6] 取 time/ms 22,141,426,981,1827,3101
。它们分别与 9·k^2+9·k 和 13·k^3+8·k^2 非常吻合,平均分数误差分别为 ≈3.3% 和 ≈1.6%。 (我们包括前两个最高阶项,因为它们的贡献很小但很重要。)
平时比较懒,模逆计算如下:
def inv(a,m):
return 1 if a==1 else ((a-inv(m%a,a))*m+1)//a
print(inv(100**7000,99**7001))
但我很想知道传递更多信息的方法,即 Bezout 定理的解决方案(而不是一对定理中的一个),在实践中是否会产生更快或更慢的算法:
def bez(a,b):
# returns [x,y,d] where a*x+b*y = d = gcd(a,b) since (b%a)*y+a*(x+(b//a)*y)=d
if a==0: return [0,1,b] if b>0 else [0,-1,-b]
r=bez(b%a,a)
return [r[1]-(b//a)*r[0],r[0],r[2]]
def inv(a,m):
r=bez(a,m)
if r[2]!=1: return None
return r[0] if r[0]>=0 else r[0]+abs(m)
print(inv(100**7000,99**7001))
我惊奇地发现,后者运行比前者快了50多倍!但是两者都使用几乎相同数量的递归调用和每次调用 1 个整数除法和 1 个模运算,并且 ope运行ds 的位长平均大约是前者的两倍(因为涉及的参数相同), 所以我只期望它的时间复杂度大约是后者的4倍,而不是50倍。
So why am I observing this strange speedup?
请注意,我使用的是 Python 3,我在 运行 online 时观察到这一点,并在顶部添加了以下代码以停止 Python 解释器抱怨超过最大递归深度或堆栈 space:
import resource,sys
sys.setrecursionlimit(1000000)
resource.setrlimit(resource.RLIMIT_STACK,[0x10000000,resource.RLIM_INFINITY])
我终于明白了。假设初始输入是 n 位整数。在典型情况下,除了第一次调用 inv
或 inv2
之外,递归调用的参数大小平均仅相差 O(1),并且平均有 O(n) 次递归调用,两者都是由于一些数论现象。这种 O(1) 大小差异意味着这两种方法实际上具有截然不同的平均时间复杂度。我的问题中隐含的假设是两个 n 位整数的乘法或除法大约需要 O(n^2) 时间;这适用于最坏的情况(对于教科书乘法),但不适用于快速方法的平均情况!
对于fast方法,可以证明当p,q > 0时,bez(p,q)
返回的三元组[x,y,d]满足abs(x) ≤ q和abs(y) ≤ p。因此,当每个调用 bez(a,b)
执行 b%a
和 (b//a)*r[0]
时,模、除法和乘法平均需要 O(size(a)) 时间,因为 size(b)-size(a ) ∈ O(1) 平均且 abs(r[0]) ≤ a。因此总时间大约为 O(n^2).
然而,对于慢速方法,当每次调用 inv(a,m)
执行 ((a-inv(m%a,a))*m+1)//a
时,我们有 a-inv(m%a,a) 与 a 的大小大致相同,因此此除法是两个整数,其中第一个大约是第二个的两倍,这将花费 O(size(a)^2) 时间!因此总时间大约为 O(n^3).
的确,模拟结果与上述分析非常吻合。作为参考,使用快速方法 inv(100**n,99**(n+1))
where n = 1400·k for k∈[1..6] take time/ms 17,57,107,182,281,366
,而使用 slow method where n = 500· k 为 k∈[1..6] 取 time/ms 22,141,426,981,1827,3101
。它们分别与 9·k^2+9·k 和 13·k^3+8·k^2 非常吻合,平均分数误差分别为 ≈3.3% 和 ≈1.6%。 (我们包括前两个最高阶项,因为它们的贡献很小但很重要。)