将函数应用于列表的所有元素以创建新列
Applying a function to all elements of a list to create new columns
我有以下功能:
get_ym = function(x) {
paste0(str_replace(str_sub(deparse(substitute(x)), start= -11, end = -5), "[.]","-"), "-01")
}
应用于单个对象时,效果很好,如下所示:
get_ym(device.2019.01.csv)
[1] "2019-01-01"
我想将此函数应用于基本相同但日期不同的对象列表,例如 device.2019.02.csv、device.2020.03.csv 等.
当我使用lapply时,输出不是我想要的。
lapply(device_files, get_ym)
[[1]]
[1] "X[-01"
[[2]]
[1] "X[-01"
等等。
此外,我想使用 get_ym 函数在列表中的所有对象中创建新列。所以我写了
apply_ym = function(x) {
x$month = get_ym(x)
}
apply_ym(device.2020.03.csv)
但这不适用于单个对象,更不用说应用于列表了。
我做错了什么?
编辑
device_files 是这样创建的对象列表:
device_files = list.files(pattern = "^device.2")
device_files = strsplit(device_files, split = " ")
您编写的代码用于不带引号的变量。
get_ym(device.2019.01.csv)
[1] "2019-01-01"
传递带引号的变量时不起作用。
get_ym('device.2019.01.csv')
[1] "019-01.-01"
当您使用 list.files
时,您将输出作为字符变量。因此,将您的功能更改为:
library(stringr)
get_ym = function(x) {
paste0(str_replace(str_sub(x, start= -11, end = -5), "[.]","-"), "-01")
}
并将其用作。 :
x <- c('device.2019.02.csv', 'device.2020.03.csv')
sapply(x, get_ym, USE.NAMES = FALSE)
#[1] "2019-02-01" "2020-03-01"
要添加新列,您可以使用 mget
和 Map
:
device_files = list.files(pattern = "^device.2")
all_data <- Map(cbind, mget(device_files),
filename = sapply(device_files, get_ym))
我有以下功能:
get_ym = function(x) {
paste0(str_replace(str_sub(deparse(substitute(x)), start= -11, end = -5), "[.]","-"), "-01")
}
应用于单个对象时,效果很好,如下所示:
get_ym(device.2019.01.csv)
[1] "2019-01-01"
我想将此函数应用于基本相同但日期不同的对象列表,例如 device.2019.02.csv、device.2020.03.csv 等.
当我使用lapply时,输出不是我想要的。
lapply(device_files, get_ym)
[[1]]
[1] "X[-01"
[[2]]
[1] "X[-01"
等等。
此外,我想使用 get_ym 函数在列表中的所有对象中创建新列。所以我写了
apply_ym = function(x) {
x$month = get_ym(x)
}
apply_ym(device.2020.03.csv)
但这不适用于单个对象,更不用说应用于列表了。
我做错了什么?
编辑
device_files 是这样创建的对象列表:
device_files = list.files(pattern = "^device.2")
device_files = strsplit(device_files, split = " ")
您编写的代码用于不带引号的变量。
get_ym(device.2019.01.csv)
[1] "2019-01-01"
传递带引号的变量时不起作用。
get_ym('device.2019.01.csv')
[1] "019-01.-01"
当您使用 list.files
时,您将输出作为字符变量。因此,将您的功能更改为:
library(stringr)
get_ym = function(x) {
paste0(str_replace(str_sub(x, start= -11, end = -5), "[.]","-"), "-01")
}
并将其用作。 :
x <- c('device.2019.02.csv', 'device.2020.03.csv')
sapply(x, get_ym, USE.NAMES = FALSE)
#[1] "2019-02-01" "2020-03-01"
要添加新列,您可以使用 mget
和 Map
:
device_files = list.files(pattern = "^device.2")
all_data <- Map(cbind, mget(device_files),
filename = sapply(device_files, get_ym))