有什么方法可以将 hadoop 管道作业添加到 GCP 中的工作流

Is there any way to add a hadoop pipe job to workflow in GCP

我正在尝试将 hadoop 管道作业添加到 GCP 中的工作流模板,但在任何地方都没有给出这样的示例。 google 的官方文档指定了如何提交 hadoop 作业,但是没有这样的参数可用于提交 hadoop 管道作业。

不,Dataproc Jobs API 和 Dataproc Workflows 不直接支持 Hadoop Pipes,并且没有计划在不久的将来添加对 Hadoop Pipes 的支持。

如果可以通过指定 Hadoop Pipes main class 使用 hadoop jar 命令而不是 hadoop pipes 运行 Hadoop Pipes 作业,那么您可以使用常规 Hadoop Dataproc Job到运行它。