BigQuery table 数字不断增长 - 如何阻止它?
BigQuery table number grows limetless - how to stop it?
我们已经收集了 3 个月的日志信息,信息量巨大,因为所有这些表都有日志条目,我们希望删除最旧的条目以及存储它们的表。
我们尝试了不同的方法,使用 bq
命令工具或发出 API 休息服务请求。我们已经成功了。
现在,问题是:是否有更合适的工具可以简化 BigQuery 中日志表的管理?我正在考虑 Unix/Linux 上的 logrotate
这样的工具。
我们使用的 "Tool" 是在数据集级别设置的过期时间。它的工作原理完全符合您的预期 w/o 您的进一步参与。
假设您设置 90 天。
任何新的 table "automaticaly" 都将过期设置为创建后的 90 天。
参见 https://cloud.google.com/bigquery/docs/reference/v2/datasets
中的 "defaultTableExpirationMs"
感谢您的回复,它非常有用。文档中有一个隐藏的细节,在我看来有点不清楚。
对于那些想要设置 defaultTableExpirationMs 的用户,您需要以秒而不是毫秒为单位指定到期时间。此值将添加到 table 创建时间。
我发出了下面的命令并为我工作:
bq update --default_table_expiration 5184000 -d your_project:data_set
注意: table 仍然是两个月 (5184000 = 60 * 60 * 24 * 60)。
我们已经收集了 3 个月的日志信息,信息量巨大,因为所有这些表都有日志条目,我们希望删除最旧的条目以及存储它们的表。
我们尝试了不同的方法,使用 bq
命令工具或发出 API 休息服务请求。我们已经成功了。
现在,问题是:是否有更合适的工具可以简化 BigQuery 中日志表的管理?我正在考虑 Unix/Linux 上的 logrotate
这样的工具。
我们使用的 "Tool" 是在数据集级别设置的过期时间。它的工作原理完全符合您的预期 w/o 您的进一步参与。
假设您设置 90 天。
任何新的 table "automaticaly" 都将过期设置为创建后的 90 天。
参见 https://cloud.google.com/bigquery/docs/reference/v2/datasets
中的 "defaultTableExpirationMs"感谢您的回复,它非常有用。文档中有一个隐藏的细节,在我看来有点不清楚。
对于那些想要设置 defaultTableExpirationMs 的用户,您需要以秒而不是毫秒为单位指定到期时间。此值将添加到 table 创建时间。
我发出了下面的命令并为我工作:
bq update --default_table_expiration 5184000 -d your_project:data_set
注意: table 仍然是两个月 (5184000 = 60 * 60 * 24 * 60)。