使用 Azure 数据工厂将多个 xml 文件合并为一个 csv 文件

Merging multiple xml files to a csv file using azure Data Factory

我已经建立了一个数据工厂管道来下载 zip 文件(打开 https 链接源 Url 参考:https://clinicaltrials.gov/AllPublicXML.zip). Unzip the same files to a folder that has multiple files of xml format. 现在我想将文件夹中的所有 XML 文件合并到一个CSV 文件。我在数据工厂中使用副本 activity。在导入架构时,我收到以下错误消息

Input XML file 'input/ALLPublicXML.zip' is invalid with parsing error 'Data at the root level is invalid. Line 1, position 1.'. Data at the root level is invalid. Line 1, position 1. . Activity ID: 358b3545-f49c-4bba-8adc-13fb3de9bb20

不太确定哪里出了问题,但如果有人能指导我完成该过程,那将非常有帮助。

这似乎是一个编码问题,你能检查一下文件的编码吗,它应该遵循以下编码格式:

文件中可能有一些额外的字符不允许读取,可以找到更多信息here