R purrr::partial -- 它如何处理部分参数?

R purrr::partial -- how does it handle partialized arguments?

我很长一段时间以来一直是 R 的 purrr 包的热心用户,最近 运行 遇到了一个关于 purrr::partial 的问题。假设我定义了一个双参数函数

f <- function(x, y) x + y

并通过将 y 参数设置为某个全局变量的值来对其进行部分化:

yy <- 1
fp <- partial(f, y = !!yy)
fp(3)                       # 3 + 1 = 4

取消引用 yy(即,使用 y = !!yy 而不是 y = yy)导致 yy 在创建 fp 时仅计算一次;特别是,在此步骤之后修改 yy 不会改变 fp:

yy <- 2
fp(3)                       # still: 3 + 1 = 4

这是我的问题:partial 在评估 yy 之后究竟做了什么? -- 我看到两种可能性:

  1. yy 的值“硬连接”到 fp 的主体中,这意味着调用 fp 时它不会作为参数传递。
  2. yy 的值或多或少被视为 y 参数的默认值(没有覆盖默认值的选项),这意味着 fp 在内部调用f(或其副本),yy 的值作为与 y 匹配的参数静默传递给它。在这种情况下 fp 只不过是 f.
  3. 的语法包装器

为了探索第二种可能性,我在定义 fp 之后修改了 f 的定义。这不会改变 fp,这意味着 fp 不包含对 f 的任何外部引用;然而,这并不排除 fp 包含旧版本 f 的(理论上的)可能性。 (结论:这种方法没有帮助。)

激发我的问题的一些实际背景:在我当前的项目中,我定义了许多函数,这些函数使用 (a) 因调用而异的参数,(b) 表示“配置数据”或“领域知识”的参数。与 (b) 参数匹配的数据(可能是大量数据)不会随调用而改变,但在我提交更新时可能会改变;无论如何,我认为这些数据不应该在我的函数中进行硬编码。我的策略是在启动时从一些文件中读取配置数据,并通过偏化 (b) 中的参数将其集成到我的函数中。通过 purrr::pmap 将偏函数应用到一些 tibbles 结果有点慢,这让我怀疑在调用函数时配置数据可能仍然被传递——因此我的问题。 (如果有人对上面简要描述的“偏向策略”有一些想法,我也会对这些产生浓厚的兴趣。)

好像是选项2,试试:

f <- function(x, y) x + y
yy <- 5
fp1 <- partial(f, y = !! yy)
debugonce(f)
fp1(3)

在这里你可以看到,如果在 RStudio 中,调试器将打开原始函数 f,参数 x = 3y = 5 被传递到该函数。但是,偏函数不是调用真正的函数 f 而是它的引用副本。如果在 f 被部分化后更改它,调试器将不再找到它。

f <- function(x, y) x + y
yy <- 5
fp1 <- partial(f, y = !! yy)
f <- function(x, y) x + 2 * y
debugonce(f)
fp1(3) # debugger will not open

可以通过构造函数来偏化自己来模仿 partial 的行为。但是,在这种情况下,fyy 都不会被捕获,因此更改它们将影响偏函数的输出:

f <- function(x, y) x + y
yy <- 5

# similar to `partial` but captures neither `f` nor `yy`
fp2 <- function(x) f(x, yy) 
fp2(3)
#> [1] 8
# so if yy changes, so will the output of fp2
yy <- 10
fp2(3)
#> [1] 13
# and if f changes, so will the output of fp2
f <- function(x, y) x + 2 * y
fp2(3)
#> [1] 23

reprex package (v0.3.0)

于 2020-07-13 创建

为了更好地理解 partial 的工作原理,我们可以按以下方式构造一个 simple_partial 函数:

library(rlang)

f <- function(x, y) x + y
yy <- 5

simple_partial <- function(.f, ...) {
  
  # capture arguments
  args <- enquos(...)
  # capture function
  fn_expr <- enexpr(.f)
  # construct call with function and supplied arguments 
  # in the ... go all arguments which will be supplied later
  call <- call_modify(call2(.f), !!! args, ... = )
  # turn call into a quosure (= expr and environment where it should be evaluated)
  call <- new_quosure(call, caller_env())
  # create child environment of current environment and turn it into a data mask
  mask <- new_data_mask(env())
  # return this function
  function(...) {
    # bind the ... from current environment to the data mask
    env_bind(mask, ... = env_get(current_env(), "..."))
    # evaluate the quoted call in the data mask where all additional values can be found
    eval_tidy(call, mask)
  }

}

fp3 <- simple_partial(f, y = !! yy)
fp3(1)
#> [1] 6

reprex package (v0.3.0)

于 2020-07-13 创建