R 中的 Jaccard 系数
Jaccard Coefficient in R
我在理解看似很简单的计算时遇到了一些困难。
我理解 Jaccard 系数是交集(A,B)/并集(A,B),为什么这是真的?
> sets::gset_similarity(c("1","2"), c("1","2","3"), "Jaccard")
[1] 1
是不是2/3
?
如果您传递实际的 set
数据(请参阅 ?sets::set
),它就会起作用:
gset_similarity(set("1","2"), set("1","2","3"), "Jaccard")
#[1] 0.6666667
或
gset_similarity(as.set(c("1","2")), as.set(c("1","2","3")), "Jaccard")
#[1] 0.6666667
...如果您有现有的矢量并需要转换它们。
我在理解看似很简单的计算时遇到了一些困难。
我理解 Jaccard 系数是交集(A,B)/并集(A,B),为什么这是真的?
> sets::gset_similarity(c("1","2"), c("1","2","3"), "Jaccard")
[1] 1
是不是2/3
?
如果您传递实际的 set
数据(请参阅 ?sets::set
),它就会起作用:
gset_similarity(set("1","2"), set("1","2","3"), "Jaccard")
#[1] 0.6666667
或
gset_similarity(as.set(c("1","2")), as.set(c("1","2","3")), "Jaccard")
#[1] 0.6666667
...如果您有现有的矢量并需要转换它们。