Crate 数据库快照大小
Crate DB Snapshot size
我设置了一个 python 脚本,每天中午创建一个板条箱数据库快照。
我 运行 设置回购的查询是:
CREATE REPOSITORY repo_name TYPE FS WITH (LOCATION='/path/to/folder', compress=true);
我 运行 每天为了创建快照而进行的查询是:
CREATE SNAPSHOT repo_name.{} ALL WITH (wait_for_completion=true, ignore_unavailable=true);
初始 运行,快照目录大小与数据库大小 (30GB) 相同。
大约一个月后,数据库增长到 40GB,而快照目录大小增长到 ~120GB(几乎是数据库大小的三倍!)。
这正常吗?
如果是,有没有options/optimizations我可以尝试减小快照的大小?
According to Crate table 数据未压缩。只有元数据被压缩。 (我同意这令人困惑。)
快照是 incremental 所以我不完全确定为什么它增长了这么多。 (您是否可能摄取了很多数据,这些数据随后可能被删除但在快照期间仍然存在?)可能值得直接在他们的 github 上使用 Crate 提出查询并检查这是否是错误。
我设置了一个 python 脚本,每天中午创建一个板条箱数据库快照。 我 运行 设置回购的查询是:
CREATE REPOSITORY repo_name TYPE FS WITH (LOCATION='/path/to/folder', compress=true);
我 运行 每天为了创建快照而进行的查询是:
CREATE SNAPSHOT repo_name.{} ALL WITH (wait_for_completion=true, ignore_unavailable=true);
初始 运行,快照目录大小与数据库大小 (30GB) 相同。
大约一个月后,数据库增长到 40GB,而快照目录大小增长到 ~120GB(几乎是数据库大小的三倍!)。
这正常吗?
如果是,有没有options/optimizations我可以尝试减小快照的大小?
According to Crate table 数据未压缩。只有元数据被压缩。 (我同意这令人困惑。)
快照是 incremental 所以我不完全确定为什么它增长了这么多。 (您是否可能摄取了很多数据,这些数据随后可能被删除但在快照期间仍然存在?)可能值得直接在他们的 github 上使用 Crate 提出查询并检查这是否是错误。