Google Cloud Dataflow 中的每个 GCE 实例中实例化了多少个 JVM?

How many JVMs are instantiated in each GCE instance in Google Cloud Dataflow?

我是否总是保证每个 GCE 实例恰好有 1 个数据流工作者 JVM,或者我是否会最终遇到调度程序在单个 GCE 实例上启动多个 JVM 的情况 - 例如,如果可能有很多准备运行的转换,但运行它们的 GCE 实例相对较少?

Dataflow 服务不保证每个 GCE 实例的工作 JVM 数量。

在当前实施中,每个 VM 有 1 个工作器。 worker 实际上在 Docker 容器中运行,该容器与主机上的其他进程隔离。

为了更好地利用多核 VM,未来每个 VM 的工作器数量很可能会发生变化。

同样,现在我们在 JVM 中使用单个线程来处理工作。

您可以将工作单元视为要由一个或多个转换处理的记录子集