stringdist_join 结果为 NA
stringdist_join results in NAs
我正在尝试使用 stringdist 包来进行模糊连接,我 运行 遇到了一个我不理解并且找不到答案的问题。
我想用 "dl" 方法连接这两个数据表,它会产生一个 NA,我完全不明白。也许你们中的一个人对此有解释。
代码:
library(fuzzyjoin)
test1<-as.data.frame(test1<-c("techniker"))
test2<-as.data.frame(test2<-c("technician"))
setnames(test2,1,"label")
setnames(test1,1,"label")
x <- stringdist_join(test1, test2, by = "label", mode = "left", distance_col="distance", method="dl")
如果我使用 jaccard 方法,则有一个匹配项:
y <- stringdist_join(test1, test2, by = "label", mode = "left", distance_col="distance", method="jaccard", q=4)
希望哪位大神指点一下。
干杯
穹顶
max_dist
默认设置为 2。
"tekniker"
和"technician"
之间的dl
距离大于2.
所以没有匹配项。
stringdist_join(test1, test2, by = "label", mode = "left", distance_col="distance", method="dl",max_dist=5)
# label.x label.y distance
# 1 techniker techni 3
我正在尝试使用 stringdist 包来进行模糊连接,我 运行 遇到了一个我不理解并且找不到答案的问题。 我想用 "dl" 方法连接这两个数据表,它会产生一个 NA,我完全不明白。也许你们中的一个人对此有解释。 代码:
library(fuzzyjoin)
test1<-as.data.frame(test1<-c("techniker"))
test2<-as.data.frame(test2<-c("technician"))
setnames(test2,1,"label")
setnames(test1,1,"label")
x <- stringdist_join(test1, test2, by = "label", mode = "left", distance_col="distance", method="dl")
如果我使用 jaccard 方法,则有一个匹配项:
y <- stringdist_join(test1, test2, by = "label", mode = "left", distance_col="distance", method="jaccard", q=4)
希望哪位大神指点一下。
干杯 穹顶
max_dist
默认设置为 2。
"tekniker"
和"technician"
之间的dl
距离大于2.
所以没有匹配项。
stringdist_join(test1, test2, by = "label", mode = "left", distance_col="distance", method="dl",max_dist=5)
# label.x label.y distance
# 1 techniker techni 3