Bigtable 重复数据 - GC 策略

Bigtable duplicate data - GC policy

当我向 bigtable 中的单元格插入值时,它不会覆盖以前的值,而是将相同的值添加到同一行中的相同列标识符。唯一的区别是时间戳。

这正常吗?我的 table 上的 GC 策略是默认的,所以我希望它只保留我的数据的 1 个版本。我是不是误会了什么?

common:delete_flag @ 2018/03/05-18:19:21.638000

"0"

common:delete_flag @ 2018/03/05-19:51:52.933000

"0"

common:delete_flag @ 2018/03/05-18:34:09.517000

"0"

common:delete_flag @ 2018/03/05-18:28:21.614000

"0"

common:delete_flag @ 2018/03/05-18:30:41.711000

"0"

编辑:也许这就是我的答案

您的编辑是正确的。 Bigtable 垃圾收集在后台随机发生,因此在任何时间点都可以保留多个版本。

一定要使用过滤器来限制读取操作的结果,以确保您不会看到比您需要的更多的数据。