测量两个相对频率向量之间的距离
Measuring the distance between two relative frequency vectors
我在选择合适的距离函数来衡量两个相对频率向量之间的相似性(不相似性)时遇到了问题。
更具体地说,我使用的形状特征向量包含有关图像中存在的基本形状(圆形、三角形、正方形)的数据。因此向量的形式是
[% of circles, % of triangles, % of squares]
比如一张图片包含4个圆,2个三角形,4个正方形,那么它的形状特征向量应该是:
[0.4, 0.2, 0.4]
最初的想法是简单的测量两个向量特征对应元素之间的欧几里德,然后将结果相加。但是我不相信这是最好的方法。有人可以建议一种测量这两个向量之间距离的好方法,或者针对这种情况建议任何算法吗?是否需要更复杂的概率距离函数才能获得良好的结果,例如 Chi-Squared 或 Kullback Leibler Divergence 距离函数?
谢谢
彼得
使用什么距离函数取决于你的具体任务。
我猜cosine similarity可能就是你想要的。
我在选择合适的距离函数来衡量两个相对频率向量之间的相似性(不相似性)时遇到了问题。
更具体地说,我使用的形状特征向量包含有关图像中存在的基本形状(圆形、三角形、正方形)的数据。因此向量的形式是
[% of circles, % of triangles, % of squares]
比如一张图片包含4个圆,2个三角形,4个正方形,那么它的形状特征向量应该是:
[0.4, 0.2, 0.4]
最初的想法是简单的测量两个向量特征对应元素之间的欧几里德,然后将结果相加。但是我不相信这是最好的方法。有人可以建议一种测量这两个向量之间距离的好方法,或者针对这种情况建议任何算法吗?是否需要更复杂的概率距离函数才能获得良好的结果,例如 Chi-Squared 或 Kullback Leibler Divergence 距离函数?
谢谢 彼得
使用什么距离函数取决于你的具体任务。
我猜cosine similarity可能就是你想要的。