Azure 数据工厂按文件夹合并镶木地板文件
Azure Data Factory merge parquet files by folder
我有一个 ADLS Gen2 帐户(已启用 HNS),其中包含以下格式的镶木地板文件:
-MainFolder
-SubFolder 1
-SubFolder 2
-Year
-Month
-Day
-Parquet file 01
-Parquet file 02
-...
我想用Azure Data Factory把最底层的parquet文件合并成一个文件,最终结构应该是这样的。
-MainFolder
-SubFolder 1
-SubFolder 2
-Year
-Month
-Day
-Merged Parquet File
如果我使用"Copy Data" Activiety,我只能在"Merge Files"和"Preserve Hirachie"之间选择。
有没有办法做到这一点?
感谢您的帮助!
如果合并文件在复制中不适合您 Activity,您可以使用数据流,联合转换可以将多个文件组合成一个文件输出。
我有一个 ADLS Gen2 帐户(已启用 HNS),其中包含以下格式的镶木地板文件:
-MainFolder
-SubFolder 1
-SubFolder 2
-Year
-Month
-Day
-Parquet file 01
-Parquet file 02
-...
我想用Azure Data Factory把最底层的parquet文件合并成一个文件,最终结构应该是这样的。
-MainFolder
-SubFolder 1
-SubFolder 2
-Year
-Month
-Day
-Merged Parquet File
如果我使用"Copy Data" Activiety,我只能在"Merge Files"和"Preserve Hirachie"之间选择。 有没有办法做到这一点? 感谢您的帮助!
如果合并文件在复制中不适合您 Activity,您可以使用数据流,联合转换可以将多个文件组合成一个文件输出。