名称和表达式之间的规范 NSE 区分

canonical NSE differentiation between names and expressions

是否有规范的 base-R 方法来确定函数参数是否为对象名称 literal/expression?

虽然通常不鼓励使用 NSE,但偶尔会有人有一个好主意并想使用它。我可能认为“方便”的最简单用例是 data.frame:如果包含保存的向量,它将使用对象名称作为列名称。 (事实上​​ ,许多 类 似乎将此作为制作框架的 best/only 方法进行教授。)

vec <- 1234:1235
data.frame(vec)
#    vec
# 1 1234
# 2 1235

但是输入原始向量,结果却不尽如人意:

data.frame(1234:1235)
#   X1234.1235
# 1       1234
# 2       1235

在 base R 中执行这种形式的 NSE 的一种常见方法是使用 deparse(substitute(x)),它将 return 对象名称 ("vec") 或表达式的字符串作为文字传递 ("1234:1235").

存在一些 is.* 函数(例如,is.objectis.expression),尽管它们用于不同的目的。我不想依赖 is.vector 或类似的特定于结构的函数,因为它不会概括为更复杂的结构化参数(没有显着定制)。

我的想法是 try(get(.)) 对象,如果由于某种原因(通常是“未找到”)而失败,则参数很可能是表达式或文字。 (如果未找到 NSE 对象,这将不起作用:library(ggplot2),并且调用环境中不可能存在名为 "ggplot2" 的对象。)

例如,

func <- function(x, ...) {
  xname <- deparse(substitute(x))
  isobj <- !inherits(try(get(xname), silent = TRUE), "try-error")
  if (isobj) "yes" else "no"
}

func(zz)
# [1] "yes"
func(c(zz))
# [1] "no"

(假设 func 意味着 isobj 不仅仅是 return 一个字符串。)

使用处理省略号的技术扩展该方法,我可以做到:

my_names <- function(...) {
  dot_obj_expr <- sapply(eval(substitute(alist(...))), deparse)
  nms <- names(dot_obj_expr)
  if (is.null(nms)) nms <- rep("", length(dot_obj_expr))
  hasgoodnames <- nzchar(nms) |
    !sapply(dot_obj_expr, function(obj) inherits(try(get(obj), silent = TRUE), "try-error"))
  # rational starting point
  goodnames <- sprintf("V%i", seq_along(dot_obj_expr))
  # replace those that were already named
  goodnames[nzchar(nms)] <- nms[nzchar(nms)]
  # replace those that were not named but appear to be an object-name
  goodnames[!nzchar(nms) & hasgoodnames] <- dot_obj_expr[!nzchar(nms) & hasgoodnames]
  goodnames
}

zz <- 1
my_names(zz, abc = 1:3, 1:3)
# [1] "zz"  "abc" "V3" 

### less clear when an arg is not found
rm(zz)
my_names(zz, abc = 1:3, 1:3)
# [1] "V1"  "abc" "V3" 

它提供了(也许)更合理的名称使用约定。

我还没有进行基准测试或分析来了解这是否会产生任何重大的“惩罚”。我相信 try(get(.)) 相当有效,并且由于到目前为止的代码没有改变任何对象,我认为不需要内存复制。

(本题由advanced-R告知,http://adv-r.had.co.nz/Computing-on-the-language.html.

我不确定它是否有帮助,但您似乎只想检查参数是一个符号还是其他东西。你可以用

func <- function(x, ...) {
  xobj <- substitute(x)
  if (is.symbol(xobj)) "yes" else "no"
}
func(zz)
# [1] "yes"
func(c(zz))
# [1] "no"

这将 return 对 zz “是”,无论变量 zz 是否实际存在,这可能是您想要的,也可能不是您想要的。