某物与其自身的余弦距离是多少?

What is the cosine distance of something and itself?

我在玩 scipy 的余弦距离。根据我收集到的信息,余弦距离越接近 1,向量就越相似。我在一个文本挖掘项目中得到了一些意想不到的结果,所以我决定调查最简单的情况。

import numpy as np
import scipy.spatial
arr1 = np.array([1,1])
arr2 = np.array([1,1])
print scipy.spatial.distance.cosine(arr1, arr2)

我的程序打印 0.0。

结果不应该是1.0吗?为什么或为什么不?

是余弦距离,不是cosine similarity。函数 d(u, v) 是距离的基本要求是 d(u, u) = 0.

查看scipy.spatial.distance.cosine文档字符串中公式的定义,注意公式以1 - (...)开头。您对该函数的期望可能基于 (...) 中的数量,但该表达式是余弦相似度。