Python 随机数生成因同一种子而异
Python random number generation varying for the same seed
我正在编写一些 Monte Carlo 代码 (Python 3.7),但我无法找出为什么使用相同的随机种子会得到不同的结果。
我已经缩小到我开始获得同一种子的随机结果变化的函数。我创建了一个 rng = random.Random() 的实例,以确保其他导入不会干扰 random.seed。我还用我使用的导入测试了一系列随机数(只有第三方是 numpy),这似乎也不是问题。我的代码也不是多线程的。
我通过以下方式设置我的 rng:
rng = random.Random()
rng.seed(123)
变化从这个函数开始(似乎也有变化的模式,它可以在某些运行中保持一致,然后在某些运行中变化 - 来回):
def create_self_avoiding_walk(radii, origin, rng, max_iterations=10000):
assert len(radii) > 0
previous_radii = radii[0]
previous_coords = origin
new_coord_map = np.zeros((len(radii), 3))
new_coord_map[0] = origin
for i, radius in enumerate(radii):
if i == 0:
continue
r = radius + previous_radii
for iteration in range(0, max_iterations):
theta = rng.uniform(0, 2 * np.pi)
z = rng.uniform(-r, r)
x = np.sqrt((r ** 2 - z ** 2)) * np.cos(theta)
y = np.sqrt((r ** 2 - z ** 2)) * np.sin(theta)
x += previous_coords[0]
y += previous_coords[1]
z += previous_coords[2]
proposed_coords = [x, y, z]
if coordinate_clash(np.array(proposed_coords), np.array(new_coord_map[:i]), radius, radii[:i]) is False:
new_coord_map[i] = [x, y, z]
previous_coords = [x, y, z]
break
if iteration == max_iterations - 1: # Was unable to find non-clashing structure
return np.array([])
return new_coord_map
coordinate_clash 调用以下函数:
@overload(np.float64, np.float64, np.float64, np.float64, np.float64, np.float64, float, float)
def coordinate_clash(x1, y1, z1, x2, y2, z2, radius1, radius2):
return ((x1 - x2) ** 2) + ((y1 - y2) ** 2) + ((z1 - z2) ** 2) < (
(radius1 + radius2) ** 2) - 1e-15 # Float PRECISION
@overload(np.ndarray, np.ndarray, float, float)
def coordinate_clash(vec1, vec2, radius1, radius2):
return coordinate_clash(vec1[0], vec1[1], vec1[2], vec2[0], vec2[1], vec2[2], radius1, radius2)
@overload(np.ndarray, np.ndarray, float, list)
def coordinate_clash(vec1, mat, radius1, radii):
for row, radius_entry in zip(mat, radii):
if coordinate_clash(vec1, row, radius1, radius_entry):
return True
return False
任何人都可以在上面的代码中找出任何会导致同一种子的随机序列变得不一致的地方吗?
你应该设置随机种子,如下所示:
for iteration in range(0, max_iterations):
rng.seed(0) # an fixed number
theta = rng.uniform(0, 2 * np.pi)
z = rng.uniform(-r, r)
当你想生成新的随机数字时,你应该每次都使用那个固定数字。
我现在已经解决了这个问题。我找错地方了。我的随机实例正常工作。然而,在我读取和解析数据集的地方,数据集是以不同的顺序解析的,这导致随机数生成出现波动。罪魁祸首是 运行 循环 set(data)
来设置我的数据存储。 set()
似乎没有强制执行该命令,因此它会在不同的运行中发生变化。因此,这可以直接使用sorted(set(data))
来解决。
我正在编写一些 Monte Carlo 代码 (Python 3.7),但我无法找出为什么使用相同的随机种子会得到不同的结果。
我已经缩小到我开始获得同一种子的随机结果变化的函数。我创建了一个 rng = random.Random() 的实例,以确保其他导入不会干扰 random.seed。我还用我使用的导入测试了一系列随机数(只有第三方是 numpy),这似乎也不是问题。我的代码也不是多线程的。
我通过以下方式设置我的 rng:
rng = random.Random()
rng.seed(123)
变化从这个函数开始(似乎也有变化的模式,它可以在某些运行中保持一致,然后在某些运行中变化 - 来回):
def create_self_avoiding_walk(radii, origin, rng, max_iterations=10000):
assert len(radii) > 0
previous_radii = radii[0]
previous_coords = origin
new_coord_map = np.zeros((len(radii), 3))
new_coord_map[0] = origin
for i, radius in enumerate(radii):
if i == 0:
continue
r = radius + previous_radii
for iteration in range(0, max_iterations):
theta = rng.uniform(0, 2 * np.pi)
z = rng.uniform(-r, r)
x = np.sqrt((r ** 2 - z ** 2)) * np.cos(theta)
y = np.sqrt((r ** 2 - z ** 2)) * np.sin(theta)
x += previous_coords[0]
y += previous_coords[1]
z += previous_coords[2]
proposed_coords = [x, y, z]
if coordinate_clash(np.array(proposed_coords), np.array(new_coord_map[:i]), radius, radii[:i]) is False:
new_coord_map[i] = [x, y, z]
previous_coords = [x, y, z]
break
if iteration == max_iterations - 1: # Was unable to find non-clashing structure
return np.array([])
return new_coord_map
coordinate_clash 调用以下函数:
@overload(np.float64, np.float64, np.float64, np.float64, np.float64, np.float64, float, float)
def coordinate_clash(x1, y1, z1, x2, y2, z2, radius1, radius2):
return ((x1 - x2) ** 2) + ((y1 - y2) ** 2) + ((z1 - z2) ** 2) < (
(radius1 + radius2) ** 2) - 1e-15 # Float PRECISION
@overload(np.ndarray, np.ndarray, float, float)
def coordinate_clash(vec1, vec2, radius1, radius2):
return coordinate_clash(vec1[0], vec1[1], vec1[2], vec2[0], vec2[1], vec2[2], radius1, radius2)
@overload(np.ndarray, np.ndarray, float, list)
def coordinate_clash(vec1, mat, radius1, radii):
for row, radius_entry in zip(mat, radii):
if coordinate_clash(vec1, row, radius1, radius_entry):
return True
return False
任何人都可以在上面的代码中找出任何会导致同一种子的随机序列变得不一致的地方吗?
你应该设置随机种子,如下所示:
for iteration in range(0, max_iterations):
rng.seed(0) # an fixed number
theta = rng.uniform(0, 2 * np.pi)
z = rng.uniform(-r, r)
当你想生成新的随机数字时,你应该每次都使用那个固定数字。
我现在已经解决了这个问题。我找错地方了。我的随机实例正常工作。然而,在我读取和解析数据集的地方,数据集是以不同的顺序解析的,这导致随机数生成出现波动。罪魁祸首是 运行 循环 set(data)
来设置我的数据存储。 set()
似乎没有强制执行该命令,因此它会在不同的运行中发生变化。因此,这可以直接使用sorted(set(data))
来解决。