Bigtable 重复数据 - GC 策略
Bigtable duplicate data - GC policy
当我向 bigtable 中的单元格插入值时,它不会覆盖以前的值,而是将相同的值添加到同一行中的相同列标识符。唯一的区别是时间戳。
这正常吗?我的 table 上的 GC 策略是默认的,所以我希望它只保留我的数据的 1 个版本。我是不是误会了什么?
common:delete_flag @ 2018/03/05-18:19:21.638000
"0"
common:delete_flag @ 2018/03/05-19:51:52.933000
"0"
common:delete_flag @ 2018/03/05-18:34:09.517000
"0"
common:delete_flag @ 2018/03/05-18:28:21.614000
"0"
common:delete_flag @ 2018/03/05-18:30:41.711000
"0"
编辑:也许这就是我的答案?
您的编辑是正确的。 Bigtable 垃圾收集在后台随机发生,因此在任何时间点都可以保留多个版本。
一定要使用过滤器来限制读取操作的结果,以确保您不会看到比您需要的更多的数据。
当我向 bigtable 中的单元格插入值时,它不会覆盖以前的值,而是将相同的值添加到同一行中的相同列标识符。唯一的区别是时间戳。
这正常吗?我的 table 上的 GC 策略是默认的,所以我希望它只保留我的数据的 1 个版本。我是不是误会了什么?
common:delete_flag @ 2018/03/05-18:19:21.638000
"0"
common:delete_flag @ 2018/03/05-19:51:52.933000
"0"
common:delete_flag @ 2018/03/05-18:34:09.517000
"0"
common:delete_flag @ 2018/03/05-18:28:21.614000
"0"
common:delete_flag @ 2018/03/05-18:30:41.711000
"0"
编辑:也许这就是我的答案
您的编辑是正确的。 Bigtable 垃圾收集在后台随机发生,因此在任何时间点都可以保留多个版本。
一定要使用过滤器来限制读取操作的结果,以确保您不会看到比您需要的更多的数据。