将函数应用于列表的所有元素以创建新列

Applying a function to all elements of a list to create new columns

我有以下功能:

get_ym = function(x) {
   paste0(str_replace(str_sub(deparse(substitute(x)), start= -11, end = -5), "[.]","-"), "-01")
}

应用于单个对象时,效果很好,如下所示:

get_ym(device.2019.01.csv)
[1] "2019-01-01"

我想将此函数应用于基本相同但日期不同的对象列表,例如 device.2019.02.csv、device.2020.03.csv 等.

当我使用lapply时,输出不是我想要的。

lapply(device_files, get_ym)
[[1]]
[1] "X[-01"

[[2]]
[1] "X[-01"

等等。

此外,我想使用 get_ym 函数在列表中的所有对象中创建新列。所以我写了

apply_ym = function(x) {
  x$month = get_ym(x)
}
apply_ym(device.2020.03.csv)

但这不适用于单个对象,更不用说应用于列表了。

我做错了什么?

编辑

device_files 是这样创建的对象列表:

device_files = list.files(pattern = "^device.2")
device_files = strsplit(device_files, split = " ")

您编写的代码用于不带引号的变量。

get_ym(device.2019.01.csv)
[1] "2019-01-01"

传递带引号的变量时不起作用。

get_ym('device.2019.01.csv')
[1] "019-01.-01"

当您使用 list.files 时,您将输出作为字符变量。因此,将您的功能更改为:

library(stringr)
get_ym = function(x) {
  paste0(str_replace(str_sub(x, start= -11, end = -5), "[.]","-"), "-01")
}

并将其用作。 :

x <- c('device.2019.02.csv', 'device.2020.03.csv')
sapply(x, get_ym, USE.NAMES = FALSE)
#[1] "2019-02-01" "2020-03-01"

要添加新列,您可以使用 mgetMap :

device_files = list.files(pattern = "^device.2")
all_data <- Map(cbind, mget(device_files), 
                       filename = sapply(device_files, get_ym))