Read.Table 与 Readr 包中的 Read_Table - 随 Readr 添加的额外列

Question

我正在尝试使用 readr 包读取 zip 文件。我的原始 csv 文件有 170 列。

当使用常规 read.table 函数将 zip 文件读入 R 时，不会添加额外的列：

data1 <- read.table(unz(zip_file,csv_file), skip = 10, header=T, quote="\"", sep=",")

当我尝试使用 read_table 重现此内容时，如下所示：

data2 <- read_table(unz(zip_file,csv_file), skip = 10)

还有更多额外的列。

当我使用 read.table 时有 170 列，使用 read_table 时有 1461 列。

下面列出了 excel 中的一些列（以便您了解原始内容），我想知道如何使用 read_table 函数来阅读所有内容，不添加额外的列：

Column Names: 
A
B
C
D (A)
D (B)
E F
G
A B C : 2017 D E - F G: H I
J.org - B : L -- K.org: F C
2016 TEST TESTING : Baltimore TEST TESt: H B

我认为有一堆空格、破折号、冒号等导致 read_table 添加额外的列。

如何避免有额外的列，同时保持列的原始格式？

谢谢！

Answer 1

如果您使用 readr::read_csv，它应该可以在不添加额外列的情况下工作，因为它会正确地从您的 CSV 文件中选取适当的分隔符。

data2 <- read_csv(unz(zip_file,csv_file), skip = 10)

Read.Table vs. Read_Table in Readr Package - Extra Columns Added with Readr