HBase 中的复制与快照

Replication vs Snapshot in HBase

我们有两个系统 - 一个离线系统(性能在这里并不重要),其中 MapReduce 作业 运行 在 HBase 集群上。另一个是在线系统(这里性能非常关键),其中 API 从同一个 HBase 集群读取。但是由于MapReduce jobs 运行ning在同一个集群上,在线系统上存在性能问题。因此,我们正在尝试为离线系统设置单独的 HBase 集群,这是从源集群中复制几个姓氏。 所以在源头上繁重的 MapReduce 作业 运行s。在复制集群上,只有在线系统 运行s 提供最佳性能。 我的问题是 :: 我们不能使用 HBase 中的快照功能来做同样的事情吗?我也想知道它们有什么区别?

如果您对 mapreduce 使用快照功能,它也会在实时 hbase 集群节点上花费 cpu、内存和磁盘 io。因此,如果磁盘 io 或 cpu 是您的瓶颈,那么一个用于 mapreduce 作业的单独集群是更好的解决方案。