如何将模式发现期间使用的样​​本大小增加到 'unlimited'?

how to increase the sample size used during schema discovery to 'unlimited'?

我在 SDP 中遇到了一些错误,其中一个潜在的修复方法是将模式发现期间使用的样​​本大小增加到 'unlimited'。

有关这些错误的详细信息,请参阅:

问题:

如何设置样本量?设置样本大小后,是否需要触发重新扫描?

您可以按照这些步骤更改样本量。请注意,较大的样本量会增加算法的 运行 时间,并且除了作业在 'triggered' 状态下保持一段时间外,仪表板中没有任何指示。

  1. 验证特定负载是否已停止并且仪表板状态显示为已停止(有或无错误)

  2. 查找文档 https://<account>.cloudant.com/_warehouser/<source>,其中 <source> 与您遇到问题的 Cloudant 数据库的名称匹配

    注意:如果文档id不明显请勾选https://<account>.cloudant.com/_warehouser/_all_docs

  3. "sample_size": -1(扫描数据库中的所有文档)或 "sample_size": X(扫描 10,000 个随机文档样本)或 "sample_size": X(扫描数据库中的 X 个文档,其中 X 是一个正整数)

保存文档并在仪表板中触发重新扫描。新模式发现 运行 将使用定义的样本大小执行。