如何以编程方式设置 tibble 列类型
How to set tibble column types programmatically
我使用以下方法读取一个高大的 XLSX 文件时遇到了麻烦:
> file = readxl::read_xlsx(filename, "sheetname")
避免实际 XLSX 文件的玩具示例:
> file = tibble(
+ names = c("name1", "name2", "name3"),
+ values = c(TRUE, 1, "chr")
+ )
> file
# A tibble: 3 x 2
names values
<chr> <chr>
1 name1 TRUE
2 name2 1
3 name3 chr
我想把它转换成这样:
# A tibble: 1 x 3
name1 name2 name3
<dbl> <lgl> <chr>
1 1 TRUE chr
但是因为 pivot_wider()
确定值列的类型为 <chr>
,pivot_wider()
为所有加宽的列保留该类型。
> file %>% pivot_wider(names_from = names, values_from = values)
# A tibble: 1 x 3
name1 name2 name3
<chr> <chr> <chr>
1 TRUE 1 chr
这需要我再次手动设置每个列类型。还有另一种(自动化)方式吗?这个文件的格式是固定的,但内容可能会改变,所以我不能依赖硬编码类型设置。对我来说理想情况下,我们可以做类似
的事情
readxl::read_xlsx(filename, "sheetname") %>%
pivot_wider(names_from = column1, values_from = column2, col_types = NULL)
如果我们用type.convert
换行,它会自动改变类型
library(dplyr)
library(tidyr)
file %>%
pivot_wider(names_from = names, values_from = values) %>%
type.convert(as.is = TRUE)
# A tibble: 1 x 3
# name1 name2 name3
# <lgl> <int> <chr>
#1 TRUE 1 chr
或使用deframe/as_tibble_row
,转换为tibble
library(tibble)
deframe(file) %>%
as_tibble_row %>%
type.convert(as.is = TRUE)
另一种选择是data.table::transpose
type.convert(data.table::transpose(file, make.names = 'names'), as.is = TRUE)
# name1 name2 name3
#1 TRUE 1 chr
数据
file <- structure(list(names = c("name1", "name2", "name3"), values = c("TRUE",
"1", "chr")), row.names = c(NA, -3L), class = c("tbl_df", "tbl",
"data.frame"))
我使用以下方法读取一个高大的 XLSX 文件时遇到了麻烦:
> file = readxl::read_xlsx(filename, "sheetname")
避免实际 XLSX 文件的玩具示例:
> file = tibble(
+ names = c("name1", "name2", "name3"),
+ values = c(TRUE, 1, "chr")
+ )
> file
# A tibble: 3 x 2
names values
<chr> <chr>
1 name1 TRUE
2 name2 1
3 name3 chr
我想把它转换成这样:
# A tibble: 1 x 3
name1 name2 name3
<dbl> <lgl> <chr>
1 1 TRUE chr
但是因为 pivot_wider()
确定值列的类型为 <chr>
,pivot_wider()
为所有加宽的列保留该类型。
> file %>% pivot_wider(names_from = names, values_from = values)
# A tibble: 1 x 3
name1 name2 name3
<chr> <chr> <chr>
1 TRUE 1 chr
这需要我再次手动设置每个列类型。还有另一种(自动化)方式吗?这个文件的格式是固定的,但内容可能会改变,所以我不能依赖硬编码类型设置。对我来说理想情况下,我们可以做类似
的事情readxl::read_xlsx(filename, "sheetname") %>%
pivot_wider(names_from = column1, values_from = column2, col_types = NULL)
如果我们用type.convert
换行,它会自动改变类型
library(dplyr)
library(tidyr)
file %>%
pivot_wider(names_from = names, values_from = values) %>%
type.convert(as.is = TRUE)
# A tibble: 1 x 3
# name1 name2 name3
# <lgl> <int> <chr>
#1 TRUE 1 chr
或使用deframe/as_tibble_row
,转换为tibble
library(tibble)
deframe(file) %>%
as_tibble_row %>%
type.convert(as.is = TRUE)
另一种选择是data.table::transpose
type.convert(data.table::transpose(file, make.names = 'names'), as.is = TRUE)
# name1 name2 name3
#1 TRUE 1 chr
数据
file <- structure(list(names = c("name1", "name2", "name3"), values = c("TRUE",
"1", "chr")), row.names = c(NA, -3L), class = c("tbl_df", "tbl",
"data.frame"))