组合和合并一系列数据帧

Combining and merging a sequence of data frames

我有一个包含 n 个数据帧的序列,其形式为:

n<-10 
k<-5 
d1 <- data.frame()
for(i in 1:(k)) {d1 <- rbind(d1,c(a="i+1",b="i-1",c="i/1"))}
d2 <- data.frame()
for(i in 1:(k+2)) {d2 <- rbind(d2,c(a="i+2",b="i-2",c="i/2"))}
d3 <- data.frame()
for(i in 1:(k+3)) {d3 <- rbind(d3,c(i+3, i-3, i/3))}

...

d10 <- data.frame()
for(i in 1:(k+10)) {d10 <- rbind(d10,c(i+10, i-10, i/10))}

我有这个数据框序列列表,我想将它们合并成一个单一的组合数据框。我试过这个:

total <- rbind(d1, d2,d3)

但是出错了。

Error in match.names(clabs, names(xi)) : 
  names do not match previous names

使用其他方法:

D <- list(d1,d2,d3)
newD <- data.frame()
for(i in 1:length(D)) {
  newD <- rbind(newD, cbind(frame=rep(i,length(D[[i]])),D[[i]]))
}
newD 

但是又报错了。

Error in data.frame(..., check.names = FALSE) : 
  arguments imply differing number of rows: 3, 5

如果使用相同的方法 (rbind) 和更基础的方法获得答案,那就太好了。两者都有助于我的理解。当然,如果很明显,请指出我哪里出错了。

在这种情况下 rbinding 之后,只需使用 names(df)。您 rbind 的每个数据框都需要具有相同的列名。来自 ?rbind:

...It then takes the classes of the columns from the first data frame, and matches columns by name (rather than by position).

因此,对于您的示例,您只需要为每个数据框设置相同的列名即可 rbind:

k<-5 
d1 <- data.frame()
for(i in 1:(k)) {d1 <- rbind(d1,c(a=i+1,b=i-1,c=i/1)); names(d1) <- letters[1:3]}
d2 <- data.frame()
for(i in 1:(k+2)) {d2 <- rbind(d2,c(a=i+2,b=i-2,c=i/2)); names(d2) <- letters[1:3]}
d3 <- data.frame()
for(i in 1:(k+3)) {d3 <- rbind(d3,c(a=i+3, b=i-3, c=i/3)); names(d3) <- letters[1:3]}

> rbind(d1, d2, d3)

    a  b         c
1   2  0 1.0000000
2   3  1 2.0000000
3   4  2 3.0000000
4   5  3 4.0000000
5   6  4 5.0000000
6   3 -1 0.5000000
7   4  0 1.0000000
8   5  1 1.5000000
9   6  2 2.0000000
10  7  3 2.5000000
11  8  4 3.0000000
12  9  5 3.5000000
13  4 -2 0.3333333
14  5 -1 0.6666667
15  6  0 1.0000000
16  7  1 1.3333333
17  8  2 1.6666667
18  9  3 2.0000000
19 10  4 2.3333333
20 11  5 2.6666667

关于您的示例的更多说明:您可以不使用 d1 <- rbind(d1, c(...)),而只做:d1 <- data.frame(a = i + 1, b = i + 2, c = i + 3)。然后您甚至不需要重命名您的列,因为它们都保持原样。