HBase 中的复制与快照

Replication vs Snapshot in HBase

hadoop
hbase
mapreduce
cloudera

我们有两个系统 - 一个离线系统（性能在这里并不重要），其中 MapReduce 作业运行在 HBase 集群上。另一个是在线系统（这里性能非常关键），其中 API 从同一个 HBase 集群读取。但是由于MapReduce jobs 运行ning在同一个集群上，在线系统上存在性能问题。因此，我们正在尝试为离线系统设置单独的 HBase 集群，这是从源集群中复制几个姓氏。所以在源头上繁重的 MapReduce 作业运行s。在复制集群上，只有在线系统运行s 提供最佳性能。我的问题是 :: 我们不能使用 HBase 中的快照功能来做同样的事情吗？我也想知道它们有什么区别？

如果您对 mapreduce 使用快照功能，它也会在实时 hbase 集群节点上花费 cpu、内存和磁盘 io。因此，如果磁盘 io 或 cpu 是您的瓶颈，那么一个用于 mapreduce 作业的单独集群是更好的解决方案。

HBase 中的复制与快照

Replication vs Snapshot in HBase

hadoop

hbase

mapreduce

cloudera