如何将模式发现期间使用的样本大小增加到 'unlimited'?
how to increase the sample size used during schema discovery to 'unlimited'?
我在 SDP 中遇到了一些错误,其中一个潜在的修复方法是将模式发现期间使用的样本大小增加到 'unlimited'。
有关这些错误的详细信息,请参阅:
问题:
如何设置样本量?设置样本大小后,是否需要触发重新扫描?
您可以按照这些步骤更改样本量。请注意,较大的样本量会增加算法的 运行 时间,并且除了作业在 'triggered' 状态下保持一段时间外,仪表板中没有任何指示。
验证特定负载是否已停止并且仪表板状态显示为已停止(有或无错误)
查找文档 https://<account>.cloudant.com/_warehouser/<source>
,其中 <source>
与您遇到问题的 Cloudant 数据库的名称匹配
注意:如果文档id不明显请勾选https://<account>.cloudant.com/_warehouser/_all_docs
用 "sample_size": -1
(扫描数据库中的所有文档)或 "sample_size": X
(扫描 10,000 个随机文档样本)或 "sample_size": X
(扫描数据库中的 X 个文档,其中 X 是一个正整数)
保存文档并在仪表板中触发重新扫描。新模式发现 运行 将使用定义的样本大小执行。
我在 SDP 中遇到了一些错误,其中一个潜在的修复方法是将模式发现期间使用的样本大小增加到 'unlimited'。
有关这些错误的详细信息,请参阅:
问题:
如何设置样本量?设置样本大小后,是否需要触发重新扫描?
您可以按照这些步骤更改样本量。请注意,较大的样本量会增加算法的 运行 时间,并且除了作业在 'triggered' 状态下保持一段时间外,仪表板中没有任何指示。
验证特定负载是否已停止并且仪表板状态显示为已停止(有或无错误)
查找文档
https://<account>.cloudant.com/_warehouser/<source>
,其中<source>
与您遇到问题的 Cloudant 数据库的名称匹配注意:如果文档id不明显请勾选
https://<account>.cloudant.com/_warehouser/_all_docs
用
"sample_size": -1
(扫描数据库中的所有文档)或"sample_size": X
(扫描 10,000 个随机文档样本)或"sample_size": X
(扫描数据库中的 X 个文档,其中 X 是一个正整数)
保存文档并在仪表板中触发重新扫描。新模式发现 运行 将使用定义的样本大小执行。