我对 DataFusion 数据管道有疑问

I have a question about the DataFusion Data Pipeline

我对 DataFusion 数据管道有疑问。

我用的是DataFusion企业版。

当我在DataFusion的Studio中创建数据管道时，您可以直接在config中设置出口和驱动程序的CPU和内存值。

到现在为止，我知道如果我创建一个数据管道，我将为每个数据管道创建一个 VM 实例。

不过，我刚刚看到创建了多少VM作为Worker节点，Master节点。

那么，在创建数据管道时，CPU和出口和驱动程序的内存是什么意思？

对于 Spark 管道运行，Data Fusion 将启动一个具有多个执行程序的驱动程序，通常与工作节点的数量相对应（但并非总是如此）。通常，每个工作节点执行一个执行程序。因此，驱动程序和执行程序的 CPU 和内存设置为每个执行程序和驱动程序的运行设置了 CPU 数量和内存量的上限。

实际上，如果您为执行程序设置的内存或 CPU 高于工作节点中的可用内存或 CPU，则可能无法达到此上限。