当我有多个数据文件 (.txt) 需要转换时,如何使用 DataFusion 执行 ETL 操作?在 Datafusion 中使用函数 UI

How can I use a DataFusion to perform ETL operations when I have multiple data files (.txt) to convert? Using functions within the Datafusion UI

任务概述如下。 Google 云存储 (GCS) 中的多个数据文件存储在分区 (/directory01/directory02/.../.text)

我将使用 DataFusion 来执行 ETL 工作并将其加载到 bigQuery table。

ETL操作仅在选择了一个数据文件时执行。

但是我想一次处理Google云存储中的所有数据文件,但是数据文件太多需要手动处理。

有什么好的方法请告诉我

谢谢。

正如@narendra 评论的那样,您可以将目录指定为 GCS 插件中的路径 properties/settings 并确保路径以“/”结尾。

打开插件时,您可以在“属性”选项卡右侧的“文档”选项卡中找到文档 properties/settings。