Cloud Dataprep BigQuery 更新插入

Cloud Dataprep BigQuery Upsert

从 Cloud Dataprep 发布时,是否可以更新 Google BigQuery 中的行?我在文档中找不到任何内容。

我有一个正在使用 Dataprep 预处理的数据集,其中包含每个(每天)运行 的新行和更新行。我想逐步将其写入 BigQuery,添加新行并更新现有的已更改行。

所以 Trifacta (CDP) 可以在每次作业 运行 时追加、替换或创建新文件。 您指的是 Upsert\Merge 操作。 所以这可以通过2个步骤完成。

  1. 对于 new 行,您可以使用 "append" 运行 选项
  2. 用于更新现有行 - 2 个选项。

要么 - A. 对输出文件(已经在 bigquery 中)进行联合转换,然后 deduplicate\aggregate 并选择您希望如何在被欺骗的行之间进行合并。每次新文件 made\created\updated 时都可以这样做。 B. 创建一个新文件,然后通过参数化导入文件夹中的所有文件 - 合并它们并进行 A.

中提到的分组

显然 - 选项 A 似乎更简单。

这有意义吗?