从 azure 数据湖读取 parquet 文件数据到 Excel 存储在 SharePoint Online 中

Read parquet file data from azure data lake to Excel stored in SharePoint Online

我们有以下要求将数据提取到 Excel 文件中。

实现这个的最佳方法是什么?实施服务器端 CSOM 或其他 Azure 工具会更好吗?

非常感谢您的帮助。

我可能会这样处理(组件很少,但自定义代码量最少)

流量

  1. 使用逻辑应用将 parquet 文件复制到 Azure Data Lake(或 blob)存储并触发数据工厂管道
  2. 数据工厂管道执行 Databricks Python 或 Scala 笔记本(两者都可以将数据保存到 Excel)作为输出
  3. 使用 Logic App 将 Excel 传回 SharePoint

因为

  • 逻辑应用程序 非常适合 SharePoint 操作任务编排。
  • 数据工厂 很好地编排数据块笔记本执行。
  • Databricks 可以轻松读取 Parquets,并且可以轻松地将数据保存为 Excel 文件,因此它似乎是完美的选择。

虽然在最佳情况下您需要使用 3 个组件,但只需不到 10 行代码即可完成您需要的操作。休息只是 'clicking'.

您可能会跳过数据工厂并使用逻辑应用程序通过 REST api 调用 Databricks,但是既然有开箱即用的组件可以做到这一点,为什么还要费心呢。