在 hbase 中使用过滤器进行行计数的最佳做法是什么?
What is the best practices of doing row count with filter in hbase?
我已经将 flume 中的数据插入到 HBase 中。我想检查数据一致性。
我的意思是 HBase 提供的命令 "count",它提供了 table.
的总行数
问题是 "Count" 不能与 "Filter"
一起使用
是否有一些方法可以根据某些特定条件(例如过滤器)进行行计数?
在此先感谢您的帮助。
如果您要过滤的列是行键的一部分,则设置开始和停止行键或者您可以使用模糊过滤器 这样我们就可以避免完整的 table 扫描,我们可以循环它并获得计数。相反,如果我们使用任何过滤器,如 SingleColumnValueFilter 或 HBASE 将进行完整的 table 扫描。
我已经将 flume 中的数据插入到 HBase 中。我想检查数据一致性。
我的意思是 HBase 提供的命令 "count",它提供了 table.
的总行数问题是 "Count" 不能与 "Filter"
一起使用是否有一些方法可以根据某些特定条件(例如过滤器)进行行计数?
在此先感谢您的帮助。
如果您要过滤的列是行键的一部分,则设置开始和停止行键或者您可以使用模糊过滤器 这样我们就可以避免完整的 table 扫描,我们可以循环它并获得计数。相反,如果我们使用任何过滤器,如 SingleColumnValueFilter 或 HBASE 将进行完整的 table 扫描。