通过 vector 分配多个列而不回收

Assign multiple columns via vector without recycling

我正在将测量数据作为数据框导入,并希望在文件名中给出的数据中包含实验条件。我想将 new columns 添加到表示条件的数据框中,并且我想 assign 具有文件名指定值的列。稍后,一旦我合并来自每个个体的编辑数据帧,这将有助于与其他实验条件进行比较 sample/file。

这是我预先存在的 dataframe Measurements:

的示例
Measurements <- data.frame(
  X = 1:4,
  Length = c(130, 150, 170, 140)
)

以下是 变量 的示例向量,它们将从文件名导出:

FileVars.vec <- c("Condition", "Plant")

FileInfo.vec <- c("aKG", "1")

这是我解决如何做我想做的事情的一种方法:

for (i in 1:length(FileVars.vec)) {
  Measurements[FileVars.vec[i]] <- FileInfo.vec[i]
}

这给出了期望的输出:

 X  Length Condition Plant
 1  130    aKG       1  
 2  150    aKG       1  
 3  170    aKG       1  
 4  140    aKG       1

但我对 R 的(有限)理解是,它是一种矢量化语言,通常不需要使用 for 循环。我觉得这个 更简单 代码应该可以工作:

Measurements[FileVars.vec] <- FileInfo.vec

但它不是为一整列分配一个值,而是回收每一列中的值:

X   Length Condition Plant
1   130    aKG       aKG    
2   150    1         1  
3   170    aKG       aKG    
4   140    1         1

有没有什么方法可以做一个类似的简单赋值但不回收,即一个值只赋给一整列?我想有一个简单的格式修复,但我已经搜索了超过 6 个小时的解决方案,但我没有在哪里看到这样的作业。我还考虑过创建一个仅包含实验条件的单独数据框,然后合并到实际数据框,但这对我来说似乎更迂回,尤其是在实验条件和观察结果比这些示例更多的情况下。

此外,如果有更成熟的 pipeline/package 从文件名中获取信息并将其以整洁的方式添加到数据中,那也太棒了!原始文件名类似于:

"aKG_1.csv"

感谢您帮助 R 菜鸟!祝你在debug的时候收获好码业!

我们可以转换为 list 然后赋值以避免按列回收值。因为它是一个 list,每个元素将被视为一个单元,并且通过回收这些元素

对相应的列进行分配
Measurements[FileVars.vec] <-  as.list(FileInfo.vec)

-输出

Measurements
#  X Length Condition Plant
#1 1    130       aKG     1
#2 2    150       aKG     1
#3 3    170       aKG     1
#4 4    140       aKG     1

如果我们想重置 type,请使用 type.convert

Measurements <- type.convert(Measurements, as.is = TRUE)

请注意,通过为 FileInfo.vec 创建一个 vector,它将有一个 type,即 character。相反,如果我们想要多种类型,它可以是 list

Measurements[FileVars.vec] <- list("akg", 1)

对于问题的第二部分,如果我们有一个字符串

str1 <- "aKG_1.csv"

并想从中创建两列,使用 read.csvstrsplit

Measurements[FileVars.vec] <- read.table(text = tools::file_path_sans_ext(str1),
           sep="_", header = FALSE)