在 Python multiprocessing.Pool 中共享可变全局变量
Sharing mutable global variable in Python multiprocessing.Pool
我正在尝试使用以下代码更新共享对象 (a dict
)。但它不起作用。它给我输入 dict
作为输出。
Edit: Exxentially,我在这里试图实现的是将数据(列表)中的项目附加到字典的列表中。数据项在字典中给出索引。
预期输出:{'2': [2], '1': [1, 4, 6], '3': [3, 5]}
注意:方法 2 引发错误 TypeError: 'int' object is not iterable
方法一
from multiprocessing import *
def mapTo(d,tree):
for idx, item in enumerate(list(d), start=1):
tree[str(item)].append(idx)
data=[1,2,3,1,3,1]
manager = Manager()
sharedtree= manager.dict({"1":[],"2":[],"3":[]})
with Pool(processes=3) as pool:
pool.starmap(mapTo, [(data,sharedtree ) for _ in range(3)])
- 方法二
from multiprocessing import *
def mapTo(d):
global tree
for idx, item in enumerate(list(d), start=1):
tree[str(item)].append(idx)
def initializer():
global tree
tree = dict({"1":[],"2":[],"3":[]})
data=[1,2,3,1,3,1]
with Pool(processes=3, initializer=initializer, initargs=()) as pool:
pool.map(mapTo,data)```
如果要反映更改,则需要使用托管列表。所以,以下对我有用:
from multiprocessing import *
def mapTo(d,tree):
for idx, item in enumerate(list(d), start=1):
tree[str(item)].append(idx)
if __name__ == '__main__':
data=[1,2,3,1,3,1]
with Pool(processes=3) as pool:
manager = Manager()
sharedtree= manager.dict({"1":manager.list(), "2":manager.list(),"3":manager.list()})
pool.starmap(mapTo, [(data,sharedtree ) for _ in range(3)])
print({k:list(v) for k,v in sharedtree.items()})
这是输出:
{'1': [1, 1, 1, 4, 4, 4, 6, 6, 6], '2': [2, 2, 2], '3': [3, 3, 5, 3, 5, 5]}
请注意,在使用多处理时,您应该始终使用 if __name__ == '__main__':
守卫,同时避免加星标的导入...
编辑
如果您使用的是 Python < 3.6,则必须重新分配,因此请将其用于 mapTo
:
def mapTo(d,tree):
for idx, item in enumerate(list(d), start=1):
l = tree[str(item)]
l.append(idx)
tree[str(item)] = l
最后,您没有正确使用 starmap
/map
,您将数据传递了 3 次,所以当然,所有内容都被计算了 3 次。映射操作应该作用于您正在映射的数据的每个单独元素,因此您需要这样的东西:
from functools import partial
from multiprocessing import *
def mapTo(i_d,tree):
idx,item = i_d
l = tree[str(item)]
l.append(idx)
tree[str(item)] = l
if __name__ == '__main__':
data=[1,2,3,1,3,1]
with Pool(processes=3) as pool:
manager = Manager()
sharedtree= manager.dict({"1":manager.list(), "2":manager.list(),"3":manager.list()})
pool.map(partial(mapTo, tree=sharedtree), list(enumerate(data, start=1)))
print({k:list(v) for k,v in sharedtree.items()})
我正在尝试使用以下代码更新共享对象 (a dict
)。但它不起作用。它给我输入 dict
作为输出。
Edit: Exxentially,我在这里试图实现的是将数据(列表)中的项目附加到字典的列表中。数据项在字典中给出索引。
预期输出:{'2': [2], '1': [1, 4, 6], '3': [3, 5]}
注意:方法 2 引发错误 TypeError: 'int' object is not iterable
方法一
from multiprocessing import * def mapTo(d,tree): for idx, item in enumerate(list(d), start=1): tree[str(item)].append(idx) data=[1,2,3,1,3,1] manager = Manager() sharedtree= manager.dict({"1":[],"2":[],"3":[]}) with Pool(processes=3) as pool: pool.starmap(mapTo, [(data,sharedtree ) for _ in range(3)])
- 方法二
from multiprocessing import *
def mapTo(d):
global tree
for idx, item in enumerate(list(d), start=1):
tree[str(item)].append(idx)
def initializer():
global tree
tree = dict({"1":[],"2":[],"3":[]})
data=[1,2,3,1,3,1]
with Pool(processes=3, initializer=initializer, initargs=()) as pool:
pool.map(mapTo,data)```
如果要反映更改,则需要使用托管列表。所以,以下对我有用:
from multiprocessing import *
def mapTo(d,tree):
for idx, item in enumerate(list(d), start=1):
tree[str(item)].append(idx)
if __name__ == '__main__':
data=[1,2,3,1,3,1]
with Pool(processes=3) as pool:
manager = Manager()
sharedtree= manager.dict({"1":manager.list(), "2":manager.list(),"3":manager.list()})
pool.starmap(mapTo, [(data,sharedtree ) for _ in range(3)])
print({k:list(v) for k,v in sharedtree.items()})
这是输出:
{'1': [1, 1, 1, 4, 4, 4, 6, 6, 6], '2': [2, 2, 2], '3': [3, 3, 5, 3, 5, 5]}
请注意,在使用多处理时,您应该始终使用 if __name__ == '__main__':
守卫,同时避免加星标的导入...
编辑
如果您使用的是 Python < 3.6,则必须重新分配,因此请将其用于 mapTo
:
def mapTo(d,tree):
for idx, item in enumerate(list(d), start=1):
l = tree[str(item)]
l.append(idx)
tree[str(item)] = l
最后,您没有正确使用 starmap
/map
,您将数据传递了 3 次,所以当然,所有内容都被计算了 3 次。映射操作应该作用于您正在映射的数据的每个单独元素,因此您需要这样的东西:
from functools import partial
from multiprocessing import *
def mapTo(i_d,tree):
idx,item = i_d
l = tree[str(item)]
l.append(idx)
tree[str(item)] = l
if __name__ == '__main__':
data=[1,2,3,1,3,1]
with Pool(processes=3) as pool:
manager = Manager()
sharedtree= manager.dict({"1":manager.list(), "2":manager.list(),"3":manager.list()})
pool.map(partial(mapTo, tree=sharedtree), list(enumerate(data, start=1)))
print({k:list(v) for k,v in sharedtree.items()})