Select 在 tidyverse 中读取文件时的列子样本
Select a subsample of columns when reading a file in the tidyverse
我想读取一个 csv 文件 select 只读取可用列的子集。通常我曾经使用 data.table
包的 fread
函数来执行这种过程。我可以只使用 read_csv
然后 select 感兴趣的列,但我想在读取文件时执行 selection。
这可能吗?我错过了一些 read_csv
选项吗?
您可以使用 read_csv()
的 col_types()
参数,将 cols_only()
与您需要的列及其类型(也可猜测)一起传递:
read_csv('loadTest.csv',
col_types = cols_only('col1' = col_integer(), #col1 is integer
'col2' = 'c', #col2 is character
'col8' = col_guess() #guess type
'col10' = '?' #guess type
)
)
我想读取一个 csv 文件 select 只读取可用列的子集。通常我曾经使用 data.table
包的 fread
函数来执行这种过程。我可以只使用 read_csv
然后 select 感兴趣的列,但我想在读取文件时执行 selection。
这可能吗?我错过了一些 read_csv
选项吗?
您可以使用 read_csv()
的 col_types()
参数,将 cols_only()
与您需要的列及其类型(也可猜测)一起传递:
read_csv('loadTest.csv',
col_types = cols_only('col1' = col_integer(), #col1 is integer
'col2' = 'c', #col2 is character
'col8' = col_guess() #guess type
'col10' = '?' #guess type
)
)