如何通过互联网(带ip地址的分布式计算)对独立计算机(每台计算机都有其用户名和密码)使用python ray?

How to use python ray for independent computers (each have its username and password) via internet(distributed computation with ip address)?

我知道 ray 在一个头节点(用户工作的计算机)和许多工作节点(其他计算机)中的基本用法。这可以通过为最新的 ray 0.8 填充 yaml 文件来完成。

但是,现在假设我有三台独立的机器,每台机器都有独立的ip、用户名和密码。我想连接到其中一个并将其用作头节点,将另外两个用作工作节点。但是我找不到关于射线文档的任何说明。

有谁知道如何在 ray 上进行这项工作?

如何在已经设置了 IP 和用户名的不同机器上使用 Ray,如下所述:

https://ray.readthedocs.io/en/latest/using-ray-on-a-cluster.html

所以基本上你需要在所有节点上运行 ray start,使用不同的参数来确定节点应该是头节点还是工作节点。

在这种情况下也可以使用 Ray 自动缩放器,此处介绍了如何操作:https://ray.readthedocs.io/en/latest/autoscaling.html#quick-start-private-cluster

如果您有更多问题,请告诉我们!