创建 BigQuery 项目的备份

Creating a backup of BigQuery project

我想知道在 BigQuery 中备份数据的最佳策略是什么?

到目前为止,我们正在使用 BigQuery 来存储来自不同来源的许多不同数据集。我们确实将原始数据(csv 文件)存储在一旁,但从中重新创建整个数据将是一项艰巨且耗时的任务。

有没有办法对项目中的所有datasets/tables进行快照?

因此,如果您命名上下文,那么这里的问题基本上是有意义的。

BigQuery 是一项托管服务,因此您的数据会被复制,并且您相信 Google Cloud 它将始终可用。如果出现故障,BigQuery 工程师会处理这种情况,您无法启动回滚或修复或任何管理的方式。

假设所有数据都以某种方式被清除(大地震+轰炸袭击了几个数据中心等),如果您没有重新构建的来源,您的数据就会丢失。这也适用于您保管的其他数据,而不仅仅是 BQ 项目。也许你的 CEO 凭证被黑客用来首先清除你的所有备份,然后是你当前的实例,因此所有公司的数据都丢失了,你无法将任何数据重建回正常状态,因为你不再有备份。

为了应对 BQ 服务关闭或 Google 关闭其服务或任何更糟糕情况的最终灾难,您需要备份以重建数据。如果您保留原始文件并能够重放它们就足够了。我们通常会存储它,因为在几年后我们可能会考虑将所有其他数据重新定位到不同的提供商,例如:天网数据中心等 :) 我们可以再次使用它们来重放我们的数据库状态。

您可以 export the BigQuery tables 和数据到 Google 云存储,您可以从那里移动到任何您想要冷藏的地方等等...您还可以在需要时导入最大 5TB 的文件恢复。