汉明距离和简单匹配系数有什么关系?

What's the relationship between Hamming distance and Simple Matching Coefficient?

我正在做 数据挖掘简介 的练习,但遇到了以下问题:

Jaccard 或 Hamming 距离哪种方法更类似于 简单匹配系数,以及哪种方法更类似于 余弦测量?解释。 (注:汉明测度是一个距离, 而其他三个措施有相似之处,但不要让这个混淆 你。)

我认为汉明距离类似于SMC,因为它们都查看整个数据集并比较相似或不相似的数据点。但是本书的解法如下:

汉明距离与SMC类似。事实上,SMC = 汉明 距离/位数。

解错了吗?我认为汉明距离和SMC不相等,汉明距离加上SMC等于1。

汉明/长度 = 1 - SMC

非常的关系。因此,它们的能力 相当

你 "looking at the whole data set" 的论点是错误的,each 是在一对对象上定义的?

本练习的重点是练习您的基本数学技能,并将方程式相互转换。这是您经常需要的技能:

  1. 你不需要探索等价的功能,一个就够了
  2. 等效函数中,一个可能比另一个计算效率更高
  3. 在等效函数中,由于浮点数学,一个函数可能比另一个函数更精确。