计算 R 中的表达式 data.table
Evaluate expression in R data.table
我有以下 data.table
:
> dt = data.table(expr = c("a + b", "a - b", "a * b", "a / b"), a = c(1,2,3,4), b = c(5,6,7,8))
> dt
expr a b
1: a + b 1 5
2: a - b 2 6
3: a * b 3 7
4: a / b 4 8
我的目标是获得以下 data.table
:
> dt
expr a b ans
1: a + b 1 5 6
2: a - b 2 6 -4
3: a * b 3 7 21
4: a / b 4 8 0.5
我尝试了以下方法:
> dt[, ans := eval(expr)]
Error in eval(expr, envir, enclos) : object 'expr' not found
> dt[, ans := eval(parse(text = expr))]
Error in parse(text = expr) : object 'expr' not found
知道如何根据 expr
列中的表达式计算 ans
列吗?
确实,在这样的设置中进行矢量化存在很多挑战。 eval
不期望 运行 在表达式向量上,默认情况下也没有设置为迭代环境向量。这里我定义了一个辅助函数来包装大部分迭代
calc <- function(e, ...) {
run<-function(x, ...) {
eval(parse(text=x), list(...))
}
do.call("mapply", c(list(run, e), list(...)))
}
dt[, ans:=calc(expr,a=a,b=b)]
哪个returns
expr a b ans
1: a + b 1 5 6.0
2: a - b 2 6 -4.0
3: a * b 3 7 21.0
4: a / b 4 8 0.5
随心所欲。请注意,您需要在对 calc()
的调用中命名参数,以便它知道将哪一列映射到哪个变量。
如果您的实际表达式描述了对向量化函数的调用并且每个都重复多次,这可能会更有效,因为它只解析和计算每个不同的表达式一次:
f <- function(e, .SD) eval(parse(text=e[1]), envir=.SD)
dt[, ans:=f(expr,.SD), by=expr, .SDcols=c("a", "b")]
# expr a b ans
# 1: a + b 1 5 6.0
# 2: a - b 2 6 -4.0
# 3: a * b 3 7 21.0
# 4: a / b 4 8 0.5
我有以下 data.table
:
> dt = data.table(expr = c("a + b", "a - b", "a * b", "a / b"), a = c(1,2,3,4), b = c(5,6,7,8))
> dt
expr a b
1: a + b 1 5
2: a - b 2 6
3: a * b 3 7
4: a / b 4 8
我的目标是获得以下 data.table
:
> dt
expr a b ans
1: a + b 1 5 6
2: a - b 2 6 -4
3: a * b 3 7 21
4: a / b 4 8 0.5
我尝试了以下方法:
> dt[, ans := eval(expr)]
Error in eval(expr, envir, enclos) : object 'expr' not found
> dt[, ans := eval(parse(text = expr))]
Error in parse(text = expr) : object 'expr' not found
知道如何根据 expr
列中的表达式计算 ans
列吗?
确实,在这样的设置中进行矢量化存在很多挑战。 eval
不期望 运行 在表达式向量上,默认情况下也没有设置为迭代环境向量。这里我定义了一个辅助函数来包装大部分迭代
calc <- function(e, ...) {
run<-function(x, ...) {
eval(parse(text=x), list(...))
}
do.call("mapply", c(list(run, e), list(...)))
}
dt[, ans:=calc(expr,a=a,b=b)]
哪个returns
expr a b ans
1: a + b 1 5 6.0
2: a - b 2 6 -4.0
3: a * b 3 7 21.0
4: a / b 4 8 0.5
随心所欲。请注意,您需要在对 calc()
的调用中命名参数,以便它知道将哪一列映射到哪个变量。
如果您的实际表达式描述了对向量化函数的调用并且每个都重复多次,这可能会更有效,因为它只解析和计算每个不同的表达式一次:
f <- function(e, .SD) eval(parse(text=e[1]), envir=.SD)
dt[, ans:=f(expr,.SD), by=expr, .SDcols=c("a", "b")]
# expr a b ans
# 1: a + b 1 5 6.0
# 2: a - b 2 6 -4.0
# 3: a * b 3 7 21.0
# 4: a / b 4 8 0.5