我可以将 Dataflow 作业配置为单线程吗?

Can I configure a Dataflow job to be single threaded?

我试图配置和部署真正单线程的 Cloud Dataflow 作业,以避免数据存储中 creating/updating 个实体时出现并发问题。我假设使用 n1-standard-1 机器可以确保作业在单线程、单台机器上 运行,但我逐渐了解到事实并非如此。

我已经复习了之前查询中提到的建议-

但我想避免围绕此实施窗口方法,并想知道是否有更简单的方法来简单地配置作业以确保单线程行为。

如有任何建议或见解,我们将不胜感激

我最近了解到,通过使用 n1-standard-1 的单个 worker 并另外使用以下 exec_arg --numberOfWorkerHarnessThreads=1 来保证单线程行为,因为这限制了JVM 线程也为 1。