Cloud Dataprep BigQuery 更新插入
Cloud Dataprep BigQuery Upsert
从 Cloud Dataprep 发布时,是否可以更新 Google BigQuery 中的行?我在文档中找不到任何内容。
我有一个正在使用 Dataprep 预处理的数据集,其中包含每个(每天)运行 的新行和更新行。我想逐步将其写入 BigQuery,添加新行并更新现有的已更改行。
所以 Trifacta (CDP) 可以在每次作业 运行 时追加、替换或创建新文件。
您指的是 Upsert\Merge 操作。
所以这可以通过2个步骤完成。
- 对于 new 行,您可以使用 "append" 运行 选项
- 用于更新现有行 - 2 个选项。
要么 -
A. 对输出文件(已经在 bigquery 中)进行联合转换,然后 deduplicate\aggregate 并选择您希望如何在被欺骗的行之间进行合并。每次新文件 made\created\updated 时都可以这样做。
B. 创建一个新文件,然后通过参数化导入文件夹中的所有文件 - 合并它们并进行 A.
中提到的分组
显然 - 选项 A 似乎更简单。
这有意义吗?
从 Cloud Dataprep 发布时,是否可以更新 Google BigQuery 中的行?我在文档中找不到任何内容。
我有一个正在使用 Dataprep 预处理的数据集,其中包含每个(每天)运行 的新行和更新行。我想逐步将其写入 BigQuery,添加新行并更新现有的已更改行。
所以 Trifacta (CDP) 可以在每次作业 运行 时追加、替换或创建新文件。 您指的是 Upsert\Merge 操作。 所以这可以通过2个步骤完成。
- 对于 new 行,您可以使用 "append" 运行 选项
- 用于更新现有行 - 2 个选项。
要么 - A. 对输出文件(已经在 bigquery 中)进行联合转换,然后 deduplicate\aggregate 并选择您希望如何在被欺骗的行之间进行合并。每次新文件 made\created\updated 时都可以这样做。 B. 创建一个新文件,然后通过参数化导入文件夹中的所有文件 - 合并它们并进行 A.
中提到的分组显然 - 选项 A 似乎更简单。
这有意义吗?