azure search replica/Partitions 会影响索引更新速度吗?
does azure search replica/Partitions impact index update speed?
我们在 2016 年创建了一个 Azure 搜索实例(s1、2 个副本、2 个分区),当我尝试向该实例上传 5000 万行时,我们发现旧实例仍有 3000 万的限制记录。
没问题,我新建了一个azure search instance(s1, 1 replica, 1 Partition),开始往上上传同样的数据。令我惊讶的是,与旧实例相比,新实例的上传速度要快得多(几乎是更新速度的两倍)。
我想知道可能是什么原因?我上传的索引是一个新的索引,所以没有人会查询它。这些是我在新旧搜索索引之间看到的差异:
- 新搜索实例、旧搜索实例无查询流量
确实从生产环境获取流量。但它在其他搜索索引上。
- 新搜索实例有 1 个副本、1 个分区,旧搜索实例有 2 个副本、2 个分区。
只是很好奇为什么我看到这样的速度差异。如果我 运行 一个搜索查询,实际上,新旧之间的性能将非常相似。只是索引更新速度要好很多。
查询流量是一个因素,但也可能是副本数。每个副本都会增加索引过程的工作量,而每个分区都会增加可用于索引的并行度。如果您向新服务添加了一个分区并进一步加快了索引编制速度,那么结果就不足为奇了。
综上所述,您的情况最可能的解释是您的新服务比旧服务 faster hardware 运行。这就是我们如何能够取消新服务的文档限制。
我们在 2016 年创建了一个 Azure 搜索实例(s1、2 个副本、2 个分区),当我尝试向该实例上传 5000 万行时,我们发现旧实例仍有 3000 万的限制记录。
没问题,我新建了一个azure search instance(s1, 1 replica, 1 Partition),开始往上上传同样的数据。令我惊讶的是,与旧实例相比,新实例的上传速度要快得多(几乎是更新速度的两倍)。
我想知道可能是什么原因?我上传的索引是一个新的索引,所以没有人会查询它。这些是我在新旧搜索索引之间看到的差异:
- 新搜索实例、旧搜索实例无查询流量 确实从生产环境获取流量。但它在其他搜索索引上。
- 新搜索实例有 1 个副本、1 个分区,旧搜索实例有 2 个副本、2 个分区。
只是很好奇为什么我看到这样的速度差异。如果我 运行 一个搜索查询,实际上,新旧之间的性能将非常相似。只是索引更新速度要好很多。
查询流量是一个因素,但也可能是副本数。每个副本都会增加索引过程的工作量,而每个分区都会增加可用于索引的并行度。如果您向新服务添加了一个分区并进一步加快了索引编制速度,那么结果就不足为奇了。
综上所述,您的情况最可能的解释是您的新服务比旧服务 faster hardware 运行。这就是我们如何能够取消新服务的文档限制。