R 中的 Jaccard 系数

Jaccard Coefficient in R

我在理解看似很简单的计算时遇到了一些困难。

我理解 Jaccard 系数是交集(A,B)/并集(A,B),为什么这是真的?

> sets::gset_similarity(c("1","2"), c("1","2","3"), "Jaccard")
[1] 1

是不是2/3

如果您传递实际的 set 数据(请参阅 ?sets::set),它就会起作用:

gset_similarity(set("1","2"), set("1","2","3"), "Jaccard") 
#[1] 0.6666667

gset_similarity(as.set(c("1","2")), as.set(c("1","2","3")), "Jaccard")
#[1] 0.6666667

...如果您有现有的矢量并需要转换它们。