HBase 是否使用集群中所有节点的计算能力来执行查询?

Does HBase use the compute capacity of all nodes in the cluster for query execution?

我们正在设置 1 个主节点和 2 个从节点。数据在 postgres 和 hbase 及其类似的数据集(相同的行数)中设置 - 6500 万行。然而,对于相同的查询,我们没有发现 HBase 的性能有可衡量的提高。

我的第一个想法是 - HBase 是否使用所有节点的计算能力来分叉查询?也许这就是性能没有明显提高的原因。

为什么 Postgres 和 HBase 之间的性能几乎相同的任何其他原因?要查找的任何特定配置项?

编辑:我在研究这个时发现的东西:http://www.flurry.com/2012/06/12/137492485#.VaQP_5QpBpg

这是一个既是又不是的答案。根据您为 'query' 和区域分布所做的工作,您可能会或可能不会使用所有节点。例如,如果您正在 运行 对 table 进行扫描,它将 运行 按顺序针对每个区域(假设不止一个)。但是,如果您对不同区域的键使用多重获取,这将 运行 并行。

随着区域数量的增加和您开始并行化请求(多个客户端),真正的好处将会到来。随着区域的拆分,区域将由 Master 跨区域服务器分布。