NoSQL (Cassandra/Mongo) 与 RDBMS

NoSQL (Cassandra/Mongo) vs RDBMS

您好,我正在从系统设计的角度学习 NoSQL 数据库的特性,并且还了解到许多大公司使用分片 RDBMS 而不是那些 nosql 数据库来保存他们的数据。

这是否意味着 NoSQL 数据 (Cassandra/MongoDB) 的唯一优势是因为它是现成的分布式解决方案并且维护成本低?

关系数据库和 nosql 数据库是不同的野兽。关系数据库适用于大多数用例,但它们无法满足网络规模数据的需求,因为网络规模的数据会在短时间内产生数百万条记录。为了解决这些问题(网络规模数据),设计了 nosql 解决方案。所以不要认为组织喜欢 nosql 只是为了便宜的维护,它是定义使用哪种数据库技术的用例。

read that a lot of big companies use shard rmdb

在我的上一份工作中,我的组织支持 manually-sharded Postgres 解决方案。这对我们来说是一个巨大的痛苦之源,因为它的大小很难管理和维护。请记住,RDBMS 并非真正设计为以这种方式工作。

only advantage of nosql ... is because it's an off-the shelf distributed solution

这个决定真的是权衡取舍。当您的数据工作负载无法由单个数据库实例处理,或者您需要无单点故障的正常运行时间时,NoSQL 可以为您提供帮助。为分区容错性和可用性牺牲一致性的数据库(“AP”数据库)通常被发现能够以极短的延迟处理大型工作负载,因为它们能够将数据(以及查询)传播到多个服务器实例。

此外,如果您的数据需要地理或数据中心感知,您将需要一个支持这些的数据库。试图让数据库产品以其原始设计未考虑的方式工作,是一种痛苦的方法。

cheap to maintain

询问经营企业数据库组织的任何人,他们会告诉您 NoSQL 维护起来并不便宜(或容易)。当然,您可能会得到一个您不必“购买”的开源产品,但您将需要(通常 highly-paid)数据库工程师来维护它。

scalability comes along with nosql by design, but it also seems that sql can also achieve the same and the primary issue is only the maintenance/configuration when scaling it up.

视情况而定。您计划扩展到多大,需要支持多少个数据副本?像 Apple 这样的大型企业拥有 台服务器 运行 Apache Cassandra。他们这样做是因为 iCloud 需要扩展以支持 9 亿 iPhone 用户的需求。他们可以根据对计算资源的需求轻松添加(放大)或移除(缩小)。

与使用 Cassandra (NoSQL) 相比,使用关系数据库实现该级别的可伸缩性需要做更多的工作。当您发现需要进一步扩展时,您基本上是在查看数据重新加载方案(因为分片大小本质上发生变化)以将数据获取到新实例。数据库团队将(很快)达到扩展 RDBMS 所需工作量不切实际的地步。

另一方面,客户端应用程序如何知道向哪个关系数据库服务器发送查询?对于大多数关系数据库,您最终将不得不以某种方式构建或扩充该逻辑层。当数据库实例的数量发生变化时,您也需要应用程序知道这一点。 NoSQL 数据库负责节点发现和(大部分)抽象,因此客户端应用程序无需担心它。

还要记住,并非所有的 NoSQL 数据库都是平等创建的。在某些产品上,只有某些节点会接受写入。在某些产品上,任何节点都可以处理读取或写入。关系数据库对此没有任何概念,因此您也必须考虑到这一点。

tl;dr;

比仅因缩放而进行的维护要复杂得多。如果不是,每个主要的关系数据库都会有一种简单的方法来处理它,而 NoSQL 数据库将无关紧要。但这并没有发生。