汉明距离和简单匹配系数有什么关系?
What's the relationship between Hamming distance and Simple Matching Coefficient?
我正在做 数据挖掘简介 的练习,但遇到了以下问题:
Jaccard 或 Hamming 距离哪种方法更类似于
简单匹配系数,以及哪种方法更类似于
余弦测量?解释。 (注:汉明测度是一个距离,
而其他三个措施有相似之处,但不要让这个混淆
你。)
我认为汉明距离类似于SMC,因为它们都查看整个数据集并比较相似或不相似的数据点。但是本书的解法如下:
汉明距离与SMC类似。事实上,SMC = 汉明
距离/位数。
解错了吗?我认为汉明距离和SMC不相等,汉明距离加上SMC等于1。
汉明/长度 = 1 - SMC
是非常的关系。因此,它们的能力 相当 。
你 "looking at the whole data set" 的论点是错误的,each 是在一对对象上定义的?
本练习的重点是练习您的基本数学技能,并将方程式相互转换。这是您经常需要的技能:
- 你不需要探索等价的功能,一个就够了
- 等效函数中,一个可能比另一个计算效率更高
- 在等效函数中,由于浮点数学,一个函数可能比另一个函数更精确。
我正在做 数据挖掘简介 的练习,但遇到了以下问题:
Jaccard 或 Hamming 距离哪种方法更类似于 简单匹配系数,以及哪种方法更类似于 余弦测量?解释。 (注:汉明测度是一个距离, 而其他三个措施有相似之处,但不要让这个混淆 你。)
我认为汉明距离类似于SMC,因为它们都查看整个数据集并比较相似或不相似的数据点。但是本书的解法如下:
汉明距离与SMC类似。事实上,SMC = 汉明 距离/位数。
解错了吗?我认为汉明距离和SMC不相等,汉明距离加上SMC等于1。
汉明/长度 = 1 - SMC
是非常的关系。因此,它们的能力 相当 。
你 "looking at the whole data set" 的论点是错误的,each 是在一对对象上定义的?
本练习的重点是练习您的基本数学技能,并将方程式相互转换。这是您经常需要的技能:
- 你不需要探索等价的功能,一个就够了
- 等效函数中,一个可能比另一个计算效率更高
- 在等效函数中,由于浮点数学,一个函数可能比另一个函数更精确。