从 Data Lake Store 中的多个 blob 创建单个 Azure Analysis Services table

Create single Azure Analysis Services table from many blobs in Data Lake Store

我是分析服务和数据湖的新手,从事 POC 工作。我使用数据工厂从 blob 存储中提取一些 TSV 数据,这些数据在逻辑上被组织为小 "partition" blob(数千个 blob)。我有一个根文件夹,可以认为它包含整个 table,其中包含逻辑上表示按客户进行分区的子文件夹 - 这些子文件夹包含逻辑上表示按日期对客户数据进行分区的子文件夹。我想在 Analysis Services 中将整个 folder/blob 结构建模为一个 table,但似乎无法弄清楚如何。我看过从单个 ADLS 文件创建单个 AAS table 的博客文章和示例,但关于其他数据文件布局的信息似乎很少。我的做法是错误的,还是我只是遗漏了一些明显的东西?

blog post 提供有关将多个 blob 附加到单个 table 的说明。

然后 part 3 blog post 描述了创建一些 Analysis Services 分区以提高处理性能。

最后,这个 blog post 描述了连接到 Azure Data Lake Store(相对于之前帖子中的 Azure Blob Storage)。

我会使用这些方法在 Azure Analysis Services 中创建 20-200 个分区(而不是数千个)。分区通常应至少有 800 万行以获得最佳压缩和性能。我认为这将需要将几个 blob 附加在一起才能达到该大小。