R studio 拆分写入txt文件报错

Question

我有这么大的文件名 Objects_Population - AllCells.txt 即 ~3GB，文件有 25704373 行和 132 个变量。我想读取文件并根据一个变量拆分行，该变量是名为 treatmentsum 的列。在本专栏中，我有不同条件下（3S 或 UNS）的实验性药物治疗，即用“_”连接的字符串。所以拆分会将所有具有相同处理的行放在一起。拆分文件后，我想写出拆分文件并使用处理和给出文件名。

我的代码如下：

#load libraries
library(tidyverse)
library(vroom)
library(dplyr)
library(stringr)

#read in the file, skip the first 9 rows
files<-vroom("Objects_Population - AllCells.txt", delim = "\t",skip = 9,col_names = T)

#split the files based on treatmentsum
splited<- files %>% 
  group_split(files$treatmentsum)

#write out the splitted files
output<- lapply(splited, function(i){
  for (i in 1:length(splited)) {
    write.table(splited[[i]][,1:131],file=paste(unique(splited[[i]]$treatmentsum),".txt"), sep="\t", row.names=FALSE)

  }
 })

所以当我运行它时，文件读取正确，拆分工作正常，处理按预期吐出，即我得到 1092 的列表（在环境中显示），每个列表包含具有相同处理的行。然而，每次它给我写了 233 个文件后，代码都会死掉。这个错误我已经截图了，生成的文件都是3S，没有生成UNS文件（右下角文件目录截图可以看到）。有人可以帮我解决这个问题并让我知道错误的含义吗？

Answer 1

我想出了一些文件名，因为治疗名称会在其中包含“/”。受此启发

library(tidyverse)
library(vroom)
library(dplyr)
library(stringr)
files<-vroom("Objects_Population - AllCells.txt", delim = "\t",skip = 9,col_names = T)


splited<- files %>% 
  group_split(files$treatmentsum)



output<- lapply(splited, function(i){
  for (i in 1:length(splited)) {
    write.table(splited[[i]][,1:131],file=paste0(gsub("/","",unique(splited[[i]]$treatmentsum)),".txt"), sep="\t", 
row.names=FALSE)

  }
 })

R studio 拆分写入txt文件报错

Error in splitting and writing txt files in R studio

r

filesplitting

file-writing

txt