agrep 函数中的重复项
duplicates in agrep function
我有以下代码:
x <- data.frame("SN" = 1:2, "Name" = c("aaa","bbb"))
y <- data.frame("SN" = 1:2, "Name" = c("aa1","aa2"))
x$partials<- as.character(sapply(x$Name, agrep, y$Name,max.distance = 1,value=T))
x
输出如下:
> x
SN Name partials
1 1 aaa c("aa1", "aa2")
2 2 bbb character(0)
但是我期待以下输出:
有什么想法吗?
您可能正在寻找这个。
首先,如果 character(0)
,sapply()
什么都不输出。为防止出现这种情况,您可以说它是 NA
或文本 "character(0)"
(如果您确实需要)。
z <- setNames(sapply(x$Name, function(a) {
ag <- agrep(a, y$Name, max.distance=1, value=TRUE)
if (identical(ag, character(0))) NA # set to "character(0)" at will
else ag
}), x$Name)
然后,将您得到的列表转换为矩阵。
z <- do.call(rbind, z)
我们需要 melt()
它以获得正确的格式。一个好方法是 data.table
.
library(data.table)
z <- setNames(melt(z)[-2], c("Name", "partials"))
现在,我们只需将 x 与新数据合并即可得到结果,确保 z
.
的行唯一
res <- merge(x, unique(z))[c(2, 1, 3)]
> res
SN Name partials
1 1 aaa aa1
2 1 aaa aa2
3 2 bbb <NA>
我有以下代码:
x <- data.frame("SN" = 1:2, "Name" = c("aaa","bbb"))
y <- data.frame("SN" = 1:2, "Name" = c("aa1","aa2"))
x$partials<- as.character(sapply(x$Name, agrep, y$Name,max.distance = 1,value=T))
x
输出如下:
> x
SN Name partials
1 1 aaa c("aa1", "aa2")
2 2 bbb character(0)
但是我期待以下输出:
有什么想法吗?
您可能正在寻找这个。
首先,如果 character(0)
,sapply()
什么都不输出。为防止出现这种情况,您可以说它是 NA
或文本 "character(0)"
(如果您确实需要)。
z <- setNames(sapply(x$Name, function(a) {
ag <- agrep(a, y$Name, max.distance=1, value=TRUE)
if (identical(ag, character(0))) NA # set to "character(0)" at will
else ag
}), x$Name)
然后,将您得到的列表转换为矩阵。
z <- do.call(rbind, z)
我们需要 melt()
它以获得正确的格式。一个好方法是 data.table
.
library(data.table)
z <- setNames(melt(z)[-2], c("Name", "partials"))
现在,我们只需将 x 与新数据合并即可得到结果,确保 z
.
res <- merge(x, unique(z))[c(2, 1, 3)]
> res
SN Name partials
1 1 aaa aa1
2 1 aaa aa2
3 2 bbb <NA>