R studio 拆分写入txt文件报错
Error in splitting and writing txt files in R studio
我有这么大的文件名 Objects_Population - AllCells.txt 即 ~3GB,文件有 25704373 行和 132 个变量。我想读取文件并根据一个变量拆分行,该变量是名为 treatmentsum 的列。在本专栏中,我有不同条件下(3S 或 UNS)的实验性药物治疗,即用“_”连接的字符串。所以拆分会将所有具有相同处理的行放在一起。拆分文件后,我想写出拆分文件并使用处理和给出文件名。
我的代码如下:
#load libraries
library(tidyverse)
library(vroom)
library(dplyr)
library(stringr)
#read in the file, skip the first 9 rows
files<-vroom("Objects_Population - AllCells.txt", delim = "\t",skip = 9,col_names = T)
#split the files based on treatmentsum
splited<- files %>%
group_split(files$treatmentsum)
#write out the splitted files
output<- lapply(splited, function(i){
for (i in 1:length(splited)) {
write.table(splited[[i]][,1:131],file=paste(unique(splited[[i]]$treatmentsum),".txt"), sep="\t", row.names=FALSE)
}
})
所以当我 运行 它时,文件读取正确,拆分工作正常,处理按预期吐出,即我得到 1092 的列表(在环境中显示),每个列表包含具有相同处理的行。然而,每次它给我写了 233 个文件后,代码都会死掉。这个错误我已经截图了,生成的文件都是3S,没有生成UNS文件(右下角文件目录截图可以看到)。有人可以帮我解决这个问题并让我知道错误的含义吗?
我想出了一些文件名,因为治疗名称会在其中包含“/”。受此启发
library(tidyverse)
library(vroom)
library(dplyr)
library(stringr)
files<-vroom("Objects_Population - AllCells.txt", delim = "\t",skip = 9,col_names = T)
splited<- files %>%
group_split(files$treatmentsum)
output<- lapply(splited, function(i){
for (i in 1:length(splited)) {
write.table(splited[[i]][,1:131],file=paste0(gsub("/","",unique(splited[[i]]$treatmentsum)),".txt"), sep="\t",
row.names=FALSE)
}
})
我有这么大的文件名 Objects_Population - AllCells.txt 即 ~3GB,文件有 25704373 行和 132 个变量。我想读取文件并根据一个变量拆分行,该变量是名为 treatmentsum 的列。在本专栏中,我有不同条件下(3S 或 UNS)的实验性药物治疗,即用“_”连接的字符串。所以拆分会将所有具有相同处理的行放在一起。拆分文件后,我想写出拆分文件并使用处理和给出文件名。
我的代码如下:
#load libraries
library(tidyverse)
library(vroom)
library(dplyr)
library(stringr)
#read in the file, skip the first 9 rows
files<-vroom("Objects_Population - AllCells.txt", delim = "\t",skip = 9,col_names = T)
#split the files based on treatmentsum
splited<- files %>%
group_split(files$treatmentsum)
#write out the splitted files
output<- lapply(splited, function(i){
for (i in 1:length(splited)) {
write.table(splited[[i]][,1:131],file=paste(unique(splited[[i]]$treatmentsum),".txt"), sep="\t", row.names=FALSE)
}
})
所以当我 运行 它时,文件读取正确,拆分工作正常,处理按预期吐出,即我得到 1092 的列表(在环境中显示),每个列表包含具有相同处理的行。然而,每次它给我写了 233 个文件后,代码都会死掉。这个错误我已经截图了,生成的文件都是3S,没有生成UNS文件(右下角文件目录截图可以看到)。有人可以帮我解决这个问题并让我知道错误的含义吗?
我想出了一些文件名,因为治疗名称会在其中包含“/”。受此启发
library(tidyverse)
library(vroom)
library(dplyr)
library(stringr)
files<-vroom("Objects_Population - AllCells.txt", delim = "\t",skip = 9,col_names = T)
splited<- files %>%
group_split(files$treatmentsum)
output<- lapply(splited, function(i){
for (i in 1:length(splited)) {
write.table(splited[[i]][,1:131],file=paste0(gsub("/","",unique(splited[[i]]$treatmentsum)),".txt"), sep="\t",
row.names=FALSE)
}
})