如何使用 Spring DataFlow 部署自治应用程序?

How to deploy autonomous application with Spring DataFlow?

我的应用程序配置为从配置的 Kafka 读取主题,然后将转换后的结果写入 Hadoop HDFS。为此,需要在 Yarn 集群节点上启动它。

为此,我们想使用 Spring DataFlow。但是由于这个应用程序不需要来自另一个流的任何输入(它已经知道从哪里提取它的源),并且什么都不输出,我如何从它创建一个有效的 DataFlow 流? 换句话说,这将是一个仅由一个应用程序组成的流,它应该 运行 在 Yarn 节点上无限期地运行。

在这种情况下,您需要一个连接到 Kafka 中指定目的地并写入 HDFS 的流定义。

例如,流看起来像这样:

stream create a1 --definition ":myKafkaTopic > hdfs"

您可以阅读 here 了解更多信息。