还有其他有用的相似度或距离度量吗?
There are other useful similarity or distance metrics?
我正在开发一个近似计算系统。定义两个对象的相似程度是此类系统中的基本操作。
通常在计算机科学和数学中,相似度是两个对象之间距离的同义词,但我并不总是清楚在哪种应用中使用以下距离:
- Jaccard系数用于信息检索的排序和评分。
- 余弦相似度用于实向量,例如用于衡量文档之间的相似度(即使它不考虑术语位置,只考虑频率)
- 汉明距离用于二进制向量,例如用于衡量计算机视觉和图像处理中二进制描述符(如ORB)之间的相似性
- 欧几里德距离用于实向量,用于测量两点之间的距离(通常称为L^2距离)
- 核函数:在机器学习中,一些核函数(例如RBF核)用于利用核技巧进行相似性度量。
我知道这些指标中的每一个都以不同的方式定义,但我想知道是否有调查或论文列出了每个指标(或我没有列出的其他指标)在计算机科学中的可能应用报告)。你能帮我解决这个问题吗?
我正在开发一个近似计算系统。定义两个对象的相似程度是此类系统中的基本操作。
通常在计算机科学和数学中,相似度是两个对象之间距离的同义词,但我并不总是清楚在哪种应用中使用以下距离:
- Jaccard系数用于信息检索的排序和评分。
- 余弦相似度用于实向量,例如用于衡量文档之间的相似度(即使它不考虑术语位置,只考虑频率)
- 汉明距离用于二进制向量,例如用于衡量计算机视觉和图像处理中二进制描述符(如ORB)之间的相似性
- 欧几里德距离用于实向量,用于测量两点之间的距离(通常称为L^2距离)
- 核函数:在机器学习中,一些核函数(例如RBF核)用于利用核技巧进行相似性度量。
我知道这些指标中的每一个都以不同的方式定义,但我想知道是否有调查或论文列出了每个指标(或我没有列出的其他指标)在计算机科学中的可能应用报告)。你能帮我解决这个问题吗?