运行 多个服务器上的进程的多个实例

Run multiple instance of a process on a number of servers

我想 运行 随机算法的多个实例。出于性能原因,我想将任务分配到多台机器上。

通常,我运行我的程序如下:

./main < input.txt > output.txt

return 大约需要 30 分钟。

我想 运行 尽可能多地使用它,最好不要更改程序代码。我的问题是:

1 - 哪些在线服务可提供适合我需要的计算资源?

2 - 实际上,我应该如何远程启动所有进程,收到终止通知,然后汇总结果(基本上,选择最佳解决方案)。有没有我可以使用的简单框架,或者我应该研究基于 ssh 的脚本?

1 - What online services offer computing resources that would suit my need?

亚马逊 EC2。

2 - Practically, how should I launch remotely all the processes, get notified of the termination, and then aggregate the results (basically, pick up the best solution). Is there a simple framework that I could use or should I look into ssh-based scripting?

Amazon EC2 有一个 API 用于启动虚拟机。一旦启动,您确实可以使用 ssh 来控制作业,我会推荐这个解决方案。我希望存在其他用于分布式作业管理的软件,但它们的配置可能不会比 ssh 更简单。