读取 csv 文件时使用 colClasses 时 R 中的警告消息

Warning message in R when using colClasses when reading csv files

我正在使用 lapply 读取文件列表。这些文件有多个行和列,我对第一列中的第一行感兴趣。我使用的代码是:

lapply(file_list, read.csv,sep=',', header = F, col.names=F, nrow=1, colClasses = c('character', 'NULL', 'NULL'))

第一行有三列,但我只读了第一列。从 Whosebug 上的其他帖子中,我发现执行此操作的方法是使用 colClasses = c('character', 'NULL', 'NULL')。虽然这种方法有效,但我想知道导致生成以下错误消息的根本问题,并希望阻止它弹出:

"In read.table(file = file, header = header, sep = sep, quote = quote, : cols = 1 != length(data) = 3"

这是为了让您知道您只是保留了三列数据中的一列,因为它不知道如何处理 "NULL"colClasses。请注意,您的 NULL 在引号中。

一个例子:

write.csv(data.frame(fi=letters[1:3],
                            fy=rnorm(3,500,1),
                            fo=rnorm(3,50,2))
,file="a.csv",row.names = F)

write.csv(data.frame(fib=letters[2:4],
                     fyb=rnorm(3,5,1),
                     fob=rnorm(3,50,2))
          ,file="b.csv",row.names = F)

file_list=list("a.csv","b.csv")

lapply(file_list, read.csv,sep=',', header = F, col.names=F, nrow=1, colClasses = c('character', 'NULL', 'NULL'))

这导致:

[[1]]
  FALSE.
1     fi

[[2]]
  FALSE.
1    fib

Warning messages:
1: In read.table(file = file, header = header, sep = sep, quote = quote,  :
  cols = 1 != length(data) = 3

这与您使用的相同:

lapply(file_list, read.csv,sep=',', header = F, col.names=F,
 nrow=1, colClasses = c('character', 'asdasd', 'asdasd'))

但是如果您这样做,警告就会消失(结果您会得到该行的其余部分):

lapply(file_list, read.csv,sep=',', header = F, col.names=F,
  nrow=1, colClasses = c( 'character',NULL, NULL))

您可以直接输入 read.table,然后在其中搜索您的特定警告,从而查看函数源代码中错误和警告的来源。