测量两个相对频率向量之间的距离

Measuring the distance between two relative frequency vectors

我在选择合适的距离函数来衡量两个相对频率向量之间的相似性(不相似性)时遇到了问题。

更具体地说,我使用的形状特征向量包含有关图像中存在的基本形状(圆形、三角形、正方形)的数据。因此向量的形式是

[% of circles, % of triangles, % of squares]

比如一张图片包含4个圆,2个三角形,4个正方形,那么它的形状特征向量应该是:

[0.4, 0.2, 0.4]

最初的想法是简单的测量两个向量特征对应元素之间的欧几里德,然后将结果相加。但是我不相信这是最好的方法。有人可以建议一种测量这两个向量之间距离的好方法,或者针对这种情况建议任何算法吗?是否需要更复杂的概率距离函数才能获得良好的结果,例如 Chi-Squared 或 Kullback Leibler Divergence 距离函数?

谢谢 彼得

使用什么距离函数取决于你的具体任务。

我猜cosine similarity可能就是你想要的。