Python Ray 可以处理多大的数据?

How large data can Python Ray handle?

Python Ray 对于机器学习应用程序看起来很有趣。但是,我想知道 Python Ray 可以处理多大。是受内存限制还是真的能处理超出内存的数据?

目前当数据适合内存时效果最佳(如果您在集群上,则意味着集群的总内存)。如果数据超过可用内存,那么 Ray 将驱逐最近最少使用的对象。如果以后需要这些对象,将通过重新运行创建它们的任务来重建它们。