运行 并行任务 SciLuigi

Running parallel tasks SciLuigi

我被这个问题困住了。

我正在使用 SciLuigi 框架进行任务管理,但我无法 运行 并行任务。

class Workflow(sl.WorkflowTask):

    def workflow(self):
        task1 = self.new_task('task 1', Task1)
        task2 = self.new_task('task 2', Task2)
        next_task = sl.new_task('next task', NextTask)
        next_task.in_foo = task1.out_foo
        next_task.in_foo = task2.out_foo
        return next_task

class Task1(sl.Task):
    # No inputs.. just define outputs

    def out_foo(self):
        return sl.TargetInfo(self, 'foo1.txt'))

    def run(self):
        ...

class Task2(sl.Task):
    # No inputs.. just define outputs

    def out_foo(self):
        return sl.TargetInfo(self, 'foo2.txt'))

    def run(self):
        ...

class NextTask(sl.Task):
    # Input
    in_foo = None

    def out_foo(self):
        return sl.TargetInfo(self, 'foo3.txt'))

    def run(self):
        ...

sl.run(main_task_cls=Workflow, cmdline_args=['--workers=2'])

不胜感激。

干杯, 迭戈

好的,我找到了解决方案。

为了运行 Task1 和 Task2 并行我必须在 NextTask 中使用两个不同的输入,如下:

class Workflow(sl.WorkflowTask):

    def workflow(self):
        ...
        next_task.in_foo1 = task1.out_foo
        next_task.in_foo2 = task2.out_foo
        ...


    class NextTask(sl.Task): 
        # Input
        in_foo1 = None
        in_foo2 = None