如何使用欧氏距离计算 points/clusters 之间的接近度?

How do I calculate the closeness between points/clusters using euclidean distance?

考虑包含以下 4 笔交易的购物篮数据库 第 1、2、3、4、5 和 6 项。

(a) {1, 2, 3, 5},

(b) {2, 3, 4, 5},

(c) {1, 4}, 和

(d) {6}.

交易可以看作是布尔(0/1)属性的点,分别对应项目1、2、3、4、5、6。这四个点就变成了

(1,1,1,0,1,0),
(0,1,1,1,1,0),
(1,0,0,1,0,0),
(0,0,0,0,0,1).

用欧几里德距离来衡量points/clusters之间的接近程度,我如何计算

(他们说d(3,4) = sqrt(3),是吗?问题中是否缺少某些内容)

欧氏距离在您的案例中定义为:

d(i, j) = sqrt( Sum_{k=1..6} (i_k - j_k)^2 )

其中 i_k 是第 i 笔交易的第 k 项,Sum 表示这些操作的总和。

因此您必须遍历项目以计算这些值。