Stream/Task 是否可以用作仓库解决方案中的 ETL

Stream/Task can be used as ETL in warehouse solution or not

我想复制 ETL 解决方案是雪花。我已经使用流和任务实现了这一点。我在流 table 上使用存储过程,其中存在复制任何其他 ETL 工具(如 Informatica)中的逻辑的合并查询和自动化流程的任务。这种方法对于增量变化是否可行?

IMO,一种由 Snowflake 工具(Snowpipe、Streams、Tasks、存储过程)组成的 ETL 架构,是 many/most 数据管道用例的完美解决方案。我现在已经看到拥有多个内部 ETL 工具的小型和大型组织都在 Snowflake 中使用这种架构,坦率地说,因为它有效,而且这是他们用例所需的全部。

我敢肯定,在某些用例中,继续使用您最喜欢的 ETL 工具是有意义的,但如果您对这种架构感到满意并且它满足您的需求,就没有理由不使用它。

可以在此 link:

找到一个很好的数据管道架构图

https://docs.snowflake.com/en/user-guide/data-pipelines-intro.html

如果您需要有关如何使用流的更多信息,link 是开始的地方:

https://docs.snowflake.com/en/user-guide/streams.html

如果您需要有关 MERGE 命令的更多信息,文档位于此处:

https://docs.snowflake.com/en/sql-reference/sql/merge.html

MERGE 上有一个不错的博客 post:

https://dwgeek.com/snowflake-merge-statement-syntax-usage-and-examples.html/

希望对你有所帮助...丰富