大 xml 文件与多个 xml 文件

big xml files vs multiple xml files

我可能有一个愚蠢的问题,但我在这方面找不到任何明确的元素,所以我拍了:

xml 数据库中的设计模式似乎是将 xml 文件视为关系文件中的 "rows"。我发现 MarkLogic 对此有明确的建议,其中建议使用多个 xml 文件而不是大文件。但在 eXist-db 上找不到相同的内容。也推荐吗?我的意思是,我应该使用多个(一千个?)xml 个文件还是一个大文件? exist-db 有什么优点?

我可以举一些虚拟的例子:

具有个人信息的客户(假设 100,000 个)(假设 15 个 xml 具有文本内容的元素):每个客户一个 xml 文件或所有客户一个文件?

对于查询,数据存储在许多小文档或一个大文档中并没有太大区别。对于更新,小文档通常更可取。替换小文档通常比 运行 更新大文档更有效。

这真的取决于数据更改的频率。如果更新频率很高,维护小文档可能会更有效率。为了简化维护并提高性能,您甚至可以考虑根据某些标准将文档组织成更小的子集合。注意:如果您使用数千个小文档,请不要忘记增加 collectionCache 设置。