Amazon AWS 上并行为 Slurm 管理器设计的 运行 R 代码的最佳选择是什么?

What is the best option on Amazon AWS to run R code in parallel that was designed for a Slurm manager?

我目前有 R 代码,可以 运行 通过带有 shell 和批处理脚本的 Slurm 管理器。本质上,我的 shell 脚本创建了 1000 个作业数组,然后调用批处理脚本 1000 次。

我想知道如何进行此设置以及将其传输到 Amazon AWS 的最有效方法是什么。如果没有,Amazon AWS 中多次 运行 一个 R 脚本并利用尽可能多的内核的最有效方法是什么? RStudio 服务器是一个不错的选择吗?

如有任何建议,我们将不胜感激。谢谢!

星团可能是个不错的选择:

StarCluster 是用于 Amazon 的弹性计算云 (EC2) 的开源集群计算工具包

它是麻省理工学院 STAR 计划的一部分,旨在弥合科学研究与课堂之间的鸿沟

您可以轻松部署任何规模的集群,并由您选择的实例组成。 NFS、MPI 和 OpenGrid 资源管理器将开箱即用。您还可以在集群上安装 SLURM。使用单个命令,您可以启动或关闭集群。

创建和管理集群的简单命令如follows:

* Create and Manage Clusters *

StarCluster allows easily creating one or more clusters of virtual machines in the cloud:

$ starcluster start -s 10 mycluster

Use the listclusters command to keep track of your clusters:

$ starcluster listclusters

Login to the master node of your cluster:

$ starcluster sshmaster mycluster

Add additional nodes to your cluster for more compute power:

$ starcluster addnode mycluster

Remove idle nodes from your cluster to minimize costs:

$ starcluster removenode mycluster node003

When you’re done using the cluster and wish to stop paying for it:

$ starcluster terminate mycluster