将长格式转换为宽格式
Convert a long format to wide
我的数据框如下所示:
x <- data.frame(c("a","a","a","a","b","b","c","c","c","a", "a"), c(1,2,3,4,1,2,1,2,3, 1, 2))
names(x) <- c("id","nr")
id nr
1 a 1
2 a 2
3 a 3
4 a 4
5 b 1
6 b 2
7 c 1
8 c 2
9 c 3
10 a 1
11 a 2
我想要这样的东西:
id 1 2 3 4
a 1 2 3 4
a 1 2 NA NA
b 1 2 NA NA
c 1 2 3 NA
我已经使用了 dcast(x, id ~ nr, value.var ="nr")
但我收到警告:
"Aggregation function missing: defaulting to length".
我知道这是由于非唯一行造成的。我还创建了给我上面结果的组。但是有没有不用创建组就可以创建它的方法呢?
x <- data.frame(c("a","a","a","a","b","b","c","c","c","a", "a"),
c(1,1,1,1,1,1,1,1,1,2,2), c(1,2,3,4,1,2,1,2,3, 1, 2))
names(x) <- c("id", "group","nr")
dcast(x, id + group ~ nr, value.var = "nr")
您可能需要一个分组变量。我们可以使用 rleid
,然后尝试使用 data.table
的开发版本中的 dcast
,而不是像示例中那样手动创建它。即 v1.9.5+
。安装开发版本的说明是 here
library(data.table)
dcast(setDT(x)[, gr:=rleid(id)], id+gr~nr, value.var='nr')[,gr:=NULL][]
# id 1 2 3 4
#1: a 1 2 3 4
#2: a 1 2 NA NA
#3: b 1 2 NA NA
#4: c 1 2 3 NA
或者正如@Arun 在评论中提到的那样,我们可以直接在 dcast
本身
中执行此操作
dcast(setDT(x), id + rleid(id) ~ nr, value.var = 'nr')[,id_1:= NULL]
我的数据框如下所示:
x <- data.frame(c("a","a","a","a","b","b","c","c","c","a", "a"), c(1,2,3,4,1,2,1,2,3, 1, 2))
names(x) <- c("id","nr")
id nr
1 a 1
2 a 2
3 a 3
4 a 4
5 b 1
6 b 2
7 c 1
8 c 2
9 c 3
10 a 1
11 a 2
我想要这样的东西:
id 1 2 3 4
a 1 2 3 4
a 1 2 NA NA
b 1 2 NA NA
c 1 2 3 NA
我已经使用了 dcast(x, id ~ nr, value.var ="nr")
但我收到警告:
"Aggregation function missing: defaulting to length".
我知道这是由于非唯一行造成的。我还创建了给我上面结果的组。但是有没有不用创建组就可以创建它的方法呢?
x <- data.frame(c("a","a","a","a","b","b","c","c","c","a", "a"),
c(1,1,1,1,1,1,1,1,1,2,2), c(1,2,3,4,1,2,1,2,3, 1, 2))
names(x) <- c("id", "group","nr")
dcast(x, id + group ~ nr, value.var = "nr")
您可能需要一个分组变量。我们可以使用 rleid
,然后尝试使用 data.table
的开发版本中的 dcast
,而不是像示例中那样手动创建它。即 v1.9.5+
。安装开发版本的说明是 here
library(data.table)
dcast(setDT(x)[, gr:=rleid(id)], id+gr~nr, value.var='nr')[,gr:=NULL][]
# id 1 2 3 4
#1: a 1 2 3 4
#2: a 1 2 NA NA
#3: b 1 2 NA NA
#4: c 1 2 3 NA
或者正如@Arun 在评论中提到的那样,我们可以直接在 dcast
本身
dcast(setDT(x), id + rleid(id) ~ nr, value.var = 'nr')[,id_1:= NULL]