从列表中提取项目并输出到 R 中的数据框
Pull items from a list and output to a dataframe in R
我有一个由多个数据框组成的列表,我想遍历列表并拉出每个数据框的“第 n ”列,并将所有这些元素并排分组在一个数据框上。
考虑到我需要拉出此列表的第二列:
library(tidyverse)
mylist <- list(mt1 = mtcars, mt2 = mtcars*2, mt3 = mtcars*3)
我想要与此类似的结果,使用 cbind:
> mylist[[1]][2] %>%
+ cbind(mylist[[2]][2]) %>%
+ cbind(mylist[[3]][2]) %>%
+ head()
cyl cyl cyl
Mazda RX4 6 12 18
Mazda RX4 Wag 6 12 18
Datsun 710 4 8 12
Hornet 4 Drive 6 12 18
Hornet Sportabout 8 16 24
Valiant 6 12 18
但我需要一个可以遍历任意数量的列表元素的代码。我不需要根据列表元素的数量重写。我怎样才能实现它?
我可以使用 for 循环,,但输出与我需要的不同:
for (i in seq_along(mylist)){
print(mylist[[i]] %>% select(2))
}
同sapply或lapply:
sapply(mylist, function(x) x%>% select(2))
lapply(mylist, function(x) x%>% select(2))
使用 map_df 我得到了一个数据框,但每一行都在彼此之上:
> map_df(mylist, function(x) x%>% select(2)) %>%
+ head()
cyl
Mazda RX4...1 6
Mazda RX4 Wag...2 6
Datsun 710...3 4
Hornet 4 Drive...4 6
Hornet Sportabout...5 8
Valiant...6 6
如何从列表中的每个数据框中提取列,并排排列每个列?
您可以使用 map_dfc
而不是 map_df
,因为它会绑定列。
library(tidyverse)
map_dfc(mylist, select, 2) %>%
head()
# cyl...1 cyl...2 cyl...3
#Mazda RX4 6 12 18
#Mazda RX4 Wag 6 12 18
#Datsun 710 4 8 12
#Hornet 4 Drive 6 12 18
#Hornet Sportabout 8 16 24
#Valiant 6 12 18
此外,如果我们想分配一个名称(例如,为每一列添加一个序号),那么我们可以使用 map2_dfc
。您还可以传递一组不同的名称。
map2_dfc(mylist,
1:length(mylist),
\(x, y) x %>% select(2) %>% rename(!!paste0(names(.)[1], y, sep = "") := 1)) %>%
head()
# cyl1 cyl2 cyl3
#Mazda RX4 6 12 18
#Mazda RX4 Wag 6 12 18
#Datsun 710 4 8 12
#Hornet 4 Drive 6 12 18
#Hornet Sportabout 8 16 24
#Valiant 6 12 18
我会这样做:
library(dplyr)
variable_number_to_get <- 2
newList <- lapply(mylist, function (x) x %>% select(variable_number_to_get)
bind_cols(newList)
cyl...1 cyl...2 cyl...3
Mazda RX4 6 12 18
Mazda RX4 Wag 6 12 18
Datsun 710 4 8 12
Hornet 4 Drive 6 12 18
Hornet Sportabout 8 16 24
...
基础 R 选项 -
do.call(cbind.data.frame, lapply(mylist, `[[`, 2))
# mt1 mt2 mt3
#1 6 12 18
#2 6 12 18
#3 4 8 12
#4 6 12 18
#5 8 16 24
#6 6 12 18
#7 8 16 24
#8 4 8 12
#9 4 8 12
#10 6 12 18
#11 6 12 18
#...
#...
我有一个由多个数据框组成的列表,我想遍历列表并拉出每个数据框的“第 n ”列,并将所有这些元素并排分组在一个数据框上。
考虑到我需要拉出此列表的第二列:
library(tidyverse)
mylist <- list(mt1 = mtcars, mt2 = mtcars*2, mt3 = mtcars*3)
我想要与此类似的结果,使用 cbind:
> mylist[[1]][2] %>%
+ cbind(mylist[[2]][2]) %>%
+ cbind(mylist[[3]][2]) %>%
+ head()
cyl cyl cyl
Mazda RX4 6 12 18
Mazda RX4 Wag 6 12 18
Datsun 710 4 8 12
Hornet 4 Drive 6 12 18
Hornet Sportabout 8 16 24
Valiant 6 12 18
但我需要一个可以遍历任意数量的列表元素的代码。我不需要根据列表元素的数量重写。我怎样才能实现它?
我可以使用 for 循环,,但输出与我需要的不同:
for (i in seq_along(mylist)){
print(mylist[[i]] %>% select(2))
}
同sapply或lapply:
sapply(mylist, function(x) x%>% select(2))
lapply(mylist, function(x) x%>% select(2))
使用 map_df 我得到了一个数据框,但每一行都在彼此之上:
> map_df(mylist, function(x) x%>% select(2)) %>%
+ head()
cyl
Mazda RX4...1 6
Mazda RX4 Wag...2 6
Datsun 710...3 4
Hornet 4 Drive...4 6
Hornet Sportabout...5 8
Valiant...6 6
如何从列表中的每个数据框中提取列,并排排列每个列?
您可以使用 map_dfc
而不是 map_df
,因为它会绑定列。
library(tidyverse)
map_dfc(mylist, select, 2) %>%
head()
# cyl...1 cyl...2 cyl...3
#Mazda RX4 6 12 18
#Mazda RX4 Wag 6 12 18
#Datsun 710 4 8 12
#Hornet 4 Drive 6 12 18
#Hornet Sportabout 8 16 24
#Valiant 6 12 18
此外,如果我们想分配一个名称(例如,为每一列添加一个序号),那么我们可以使用 map2_dfc
。您还可以传递一组不同的名称。
map2_dfc(mylist,
1:length(mylist),
\(x, y) x %>% select(2) %>% rename(!!paste0(names(.)[1], y, sep = "") := 1)) %>%
head()
# cyl1 cyl2 cyl3
#Mazda RX4 6 12 18
#Mazda RX4 Wag 6 12 18
#Datsun 710 4 8 12
#Hornet 4 Drive 6 12 18
#Hornet Sportabout 8 16 24
#Valiant 6 12 18
我会这样做:
library(dplyr)
variable_number_to_get <- 2
newList <- lapply(mylist, function (x) x %>% select(variable_number_to_get)
bind_cols(newList)
cyl...1 cyl...2 cyl...3 Mazda RX4 6 12 18 Mazda RX4 Wag 6 12 18 Datsun 710 4 8 12 Hornet 4 Drive 6 12 18 Hornet Sportabout 8 16 24 ...
基础 R 选项 -
do.call(cbind.data.frame, lapply(mylist, `[[`, 2))
# mt1 mt2 mt3
#1 6 12 18
#2 6 12 18
#3 4 8 12
#4 6 12 18
#5 8 16 24
#6 6 12 18
#7 8 16 24
#8 4 8 12
#9 4 8 12
#10 6 12 18
#11 6 12 18
#...
#...