什么是排序上下文中的右不变性?

What is right-invariance in the context of ranking?

我正在阅读一篇名为 Unsupervised Rank Aggregation with Domain-Specific Experience 的论文,在第 2.1 节中,他们讨论了列表的两个排列之间的距离。此距离度量的一些示例是 Kendall Tau 距离和 Spearman Footrule 距离。 属性 这个距离度量可能具有右不变性。在论文中,如果一个指标有这个属性,这意味着它不依赖于对象的索引方式。

这部分让我很困惑,因为我不太了解对象等级和对象索引之间的区别。如果一个对象在排名列表中,它的索引不会直接与其排名相关吗?此外,他们提到 Kendall Tau 距离是右不变的,但它的公式表明它取决于对象 i 和 j 的索引。那么,在秩聚合的上下文中,右不变性到底是什么。

您要排名的对象以列表的形式到达算法,您要聚合的排名作为作用于列表的排列到达算法。输入列表中对象的 list/the 索引的顺序无关紧要:算法应该以相同的方式对对象进行排序(分配相同的 new indices) 无论原始顺序如何(忽略 original 索引)。新指标与排名相对应并且很重要。旧索引(在对象列表和输入排名中)是输入表示的产物,必须注意确保它们被忽略。说输入列表中对象的索引无关紧要等同于说打乱输入列表不会改变算法的输出。由于您要聚合的排名由输入列表的排列表示,因此通过某种排列打乱输入列表需要您将所有排名排列右乘以打乱排列的倒数,以便获得相同的对象实际排名.由于所有这些新的打乱排名排列仍然代表相同的排名,用于比较排名的距离度量最好对变化不敏感:这种不敏感称为右不变性。

关于Kendall tau距离的右不变性:考虑公式2(x - 3) + 6 - 2x。这看起来取决于您为 x 选择的数字,但实际上它始终为零,所以实际上并非如此。对于 Kendall tau 也是如此:它的右不变性可能不会立即显而易见(对我来说当然不明显);这是您可能必须坐下来用数学向自己证明的事情。 (如果他们甚至不引用证明,我认为如果你考虑一下它实际上是微不足道的,但这不是我的领域,我不会在没有铅笔和纸的情况下得到它。)