如何使用 PyTorch 多处理?
How to use PyTorch multiprocessing?
我正在尝试使用 python 在 pytorch
中的多处理 Pool
方法来处理图像。这是代码:
from multiprocessing import Process, Pool
from torch.autograd import Variable
import numpy as np
from scipy.ndimage import zoom
def get_pred(args):
img = args[0]
scale = args[1]
scales = args[2]
img_scale = zoom(img.numpy(),
(1., 1., scale, scale),
order=1,
prefilter=False,
mode='nearest')
# feed input data
input_img = Variable(torch.from_numpy(img_scale),
volatile=True).cuda()
return input_img
scales = [1,2,3,4,5]
scale_list = []
for scale in scales:
scale_list.append([img,scale,scales])
multi_pool = Pool(processes=5)
predictions = multi_pool.map(get_pred,scale_list)
multi_pool.close()
multi_pool.join()
我收到此错误:
`RuntimeError: Cannot re-initialize CUDA in forked subprocess. To use CUDA with multiprocessing, you must use the 'spawn' start method
`
在这一行中:
predictions = multi_pool.map(get_pred,scale_list)
谁能告诉我我做错了什么?
我建议您阅读多处理模块的文档,尤其是 this section。您将不得不通过调用 set_start_method
来更改创建子流程的方式。摘自那些引用的文档:
import multiprocessing as mp
def foo(q):
q.put('hello')
if __name__ == '__main__':
mp.set_start_method('spawn')
q = mp.Queue()
p = mp.Process(target=foo, args=(q,))
p.start()
print(q.get())
p.join()
如 pytorch documentation 中所述,处理多进程的最佳做法是使用 torch.multiprocessing
而不是 multiprocessing
。
请注意,仅在 Python 3 中支持在进程之间共享 CUDA 张量,使用 spawn
或 forkserver
作为启动方法。
在不修改您的代码的情况下,解决您遇到的错误的方法是替换
from multiprocessing import Process, Pool
与:
from torch.multiprocessing import Pool, Process, set_start_method
try:
set_start_method('spawn')
except RuntimeError:
pass
我正在尝试使用 python 在 pytorch
中的多处理 Pool
方法来处理图像。这是代码:
from multiprocessing import Process, Pool
from torch.autograd import Variable
import numpy as np
from scipy.ndimage import zoom
def get_pred(args):
img = args[0]
scale = args[1]
scales = args[2]
img_scale = zoom(img.numpy(),
(1., 1., scale, scale),
order=1,
prefilter=False,
mode='nearest')
# feed input data
input_img = Variable(torch.from_numpy(img_scale),
volatile=True).cuda()
return input_img
scales = [1,2,3,4,5]
scale_list = []
for scale in scales:
scale_list.append([img,scale,scales])
multi_pool = Pool(processes=5)
predictions = multi_pool.map(get_pred,scale_list)
multi_pool.close()
multi_pool.join()
我收到此错误:
`RuntimeError: Cannot re-initialize CUDA in forked subprocess. To use CUDA with multiprocessing, you must use the 'spawn' start method
` 在这一行中:
predictions = multi_pool.map(get_pred,scale_list)
谁能告诉我我做错了什么?
我建议您阅读多处理模块的文档,尤其是 this section。您将不得不通过调用 set_start_method
来更改创建子流程的方式。摘自那些引用的文档:
import multiprocessing as mp
def foo(q):
q.put('hello')
if __name__ == '__main__':
mp.set_start_method('spawn')
q = mp.Queue()
p = mp.Process(target=foo, args=(q,))
p.start()
print(q.get())
p.join()
如 pytorch documentation 中所述,处理多进程的最佳做法是使用 torch.multiprocessing
而不是 multiprocessing
。
请注意,仅在 Python 3 中支持在进程之间共享 CUDA 张量,使用 spawn
或 forkserver
作为启动方法。
在不修改您的代码的情况下,解决您遇到的错误的方法是替换
from multiprocessing import Process, Pool
与:
from torch.multiprocessing import Pool, Process, set_start_method
try:
set_start_method('spawn')
except RuntimeError:
pass