Cassandra:孤立的工作负载

Cassandra : isolated workloads

我有三个工作负载。

  1. DATACENTER1 通过休息服务共享数据 - 流式摄取
  2. DATACENTER2 批量加载 - 分析
  3. DATACENTER3 研究

我想隔离工作负载,我打算为每个工作负载创建一个数据中心。 该操作objective是为了防止繁重的进程消耗所有资源并保证高可用性数据。

有人已经在尝试这个了吗?

在 datacenter2 上加载期间,datacenter1 上的数据可用性是否良好?

简短的回答是工作负载不会导致跨数据中心的负载中断。工作原理如下:

从概念上讲,当您创建键空间时,Cassandra 会创建一个虚拟数据中心 (VDC)。具有相似工作负载的节点必须分配给相同的 VDC。隔离工作负载将确保只有(恰好)一个工作负载在 VDC 上执行。只要您遵循此模式,它就会起作用。

数据同步需要在繁忙节点的负载下进行监控,但这是任何 Cassandra 部署的正常问题。

Datastax Enterprise 也支持这个模型,可以看出: https://docs.datastax.com/en/datastax_enterprise/4.6/datastax_enterprise/deploy/deployWkLdSep.html#deployWkLdSep__srchWkLdSegreg