每个集合的 MarkLogic 数据库大小

MarkLogic Database Size per collection

我目前正在研究 MarkLogic 数据库大小。目前在开发数据库中,我们已经索引了大约 78000 个文档。数据库的当前大小为 424 MB。将来我们将至少有 200 万个文档。所以我应用下面的公式来获取索引 200 万个文档的数据库大小

Future storage : (424 / 78000) * 2000000= 11 GB (approx).

所以根据上面的公式,最大需要 25 GB 的存储空间。

我想知道上面的公式是否正确估算数据库大小?

另外我想知道我是否还必须考虑“集合大小”。集合有大小限制吗?

确实是高度依赖文档。如果接下来的大约 200 万个文档与您当前的 78k 个文档非常相似,那么您的估计可能很接近。但是请记住,建议将磁盘空闲 space 保持为数据库大小的 1.5 倍,以解决合并开销。

集合就像元数据"tags"。将集合应用于文档的存储开销可以忽略不计,并且没有与集合相关的大小限制。