云bigtable行过滤的性能

Performance of cloud bigtable row filtering

当您发出带行过滤的前缀扫描时,bigtable 服务器上发生了什么?

假设您使用过滤执行前缀扫描,随着时间的推移,更多的行最终被过滤掉。我想知道性能是否会因过滤而降低。

Cloud Bigtable 在进行需要过滤掉大量行的前缀扫描时是否高效?

您问题的答案在文档中

https://cloud.google.com/bigtable/docs/schema-design

例如:

要获得 Cloud Big 的最佳性能table,必须仔细考虑如何编写行键。这是因为最高效的 Cloud Bigtable 查询使用行键、行键前缀或行范围来检索数据。其他类型的查询会触发完整的 table 扫描,效率要低得多。通过现在选择正确的行键,您可以避免以后痛苦的数据迁移过程。

Is Cloud Bigtable efficient at doing prefix scans that need to filter out lots of rows?

总之不行,效率不高。 为了使您的查询更有效率,您可以提升您在查询中使用的字段:将它(它们)从列数据移动到行键。