MarkLogic 8 - 来自大型 Collection 的报告和汇总

MarkLogic 8 - Reporting and Aggregation from Large Collection

假设我有一个collection,里面有一亿records/documents。

我想创建一系列报告,其中涉及对某些列中的值求和并按不同的列分组。

XQuery 有哪些参考资料and/or MarkLogic 有谁能指点我,让我快速完成这项工作吗?

我看到 cts:avg-aggregate 看起来不错。但是我也需要分组..

此外,由于我正在处理大量数据并且需要一些时间来完成所有这些,我正在考虑将其设置为 运行 晚上更新的工作报告。

我想过使用 corb 运行 遍历记录,然后对它的输出做一些处理。这是 MarkLogic 和报告的正确方法吗?

也许本指南会有所帮助:

http://developer.marklogic.com/blog/group-by-the-marklogic-way

您有几个上面讨论的选项:

  • cts:估计
  • cts:元素值共现
  • cts:值元组 + cts:frequency