近似最近邻时间复杂度

approximate nearest neighbors time complexity

我正在阅读这篇论文Product quantization for nearest neighbor search

在第 5 页 table II 的最后一行

the complexity given in this table for searching the k smallest elements is the average complexity for n >> k and when the elements are arbitrarily ordered

也就是 n+klogkloglogn.

我想我们可以使用线性选择算法得到未排序的k个近邻O(n),然后对k个近邻进行排序O(klogk),这样我们总共可以有O(n+klogk) .但是 loglogn 术语从何而来?

文中为此参考了TAOCP的书,但我手头没有这本书,谁能帮我解释一下?

首先,Table II 报告每个步骤的复杂性,因此您必须添加所有项来衡量 ADC 的复杂性。

table的最后一行是SDC和ADC的单一复杂度,即:

n + k log k log log n

该术语对应于我们用来在一组 n 个变量中找到 k 个最小值的选择算法的平均算法成本,我们从 Donald Knuth 的书 [25] 中得到了 copy/pasted。

我手上没有这本书,无法查看,但听起来不错。


来自作者