小批量频繁更新的 CloudSearch 性能
CloudSearch performance with frequent updates of small batches
我有一个用例,我需要将小批量文档(通常是 1 到 10 个文档,每个文档 1KB)上传到 CloudSearch。每 2 或 3 秒上传一个新的批次。 CloudSearch docs for bulk uploads 说:
Make sure your batches are as close to the 5 MB limit as possible. Uploading a larger amount of smaller batches slows down the upload and indexing process.
如果文档出现在搜索结果中之前有 30 秒的延迟,那没关系。随着我的文档数量的增加,比如 500.000 个文档,我的实现是否会正常运行?
即使有 50 万个文档,索引时间也应该低于 30 秒 SLA,无论您如何或是否批量提交。
我这样说是基于我自己对 m1.small 实例类型上的 300k 文档索引和 38 个索引字段进行的测试,其中搜索文档所需的时间不到 3 秒。有很多变量可能会影响您自己的情况,例如您拥有多少索引字段、您的实例大小等,但我认为我的设置反映了不利条件(m1.small 具有复杂索引架构的实例)和仍然比您的 SLA 快一个数量级。这当然是轶事证据,但你应该没问题。