何时使用多个 azure synapse 工作区?

when to use multiple azure synapse workspaces?

我有一个 azure synapse 工作区,其中包含无服务器 sql 池中的许多管道和外部表。全部与一个特定项目相关。

还有另外 2-3 个完全独立的项目需要突触工具集。

我应该创建一个新工作区,还是让他们共享这个工作区? 用于决定的最佳标准是什么?

这可能是一个意见问题,它在 Whosebug 上的表现不太好,但话虽如此,我倾向于认为 Synapse Workspaces 类似于 SQL Server 的一个实例,所以从历史上看,为什么你会使用相同的 SQL 实例?

通常这是项目的共同点,例如相同的数据、相似的权限 (AAD) 组、相似的 HADR 要求等,所以问问自己这些问题。

请记住,您可以在一个工作区内拥有多个数据库(专用和无服务器),但只能通过 Spark Pools1[= 对专用 sql 池中的表进行跨数据库查询26=]。如果您需要分离,这可能对您有利。另请记住,您可以将多个存储帐户连接到工作区。拥有多个工作区没有成本开销,但会产生管理开销,并且跨多个数据湖、存储帐户和数据库复制任何数据会产生成本影响。

一个示例 - 我们将工作区用于环境,例如,在没有单独的开发、测试、uat Azure 订阅的情况下。

所以有几点需要考虑。


1 将这两个表导入为数据框,然后按照

将它们连接到 Synapse 笔记本中