如何从分类变量创建连续变量
How to create a continuous variable from a categorical variable
我有 classes 中个人年龄的信息。我的目标是将此信息转换为连续变量 "Age",每个变量 class 内均等分布。我怎样才能在 R 中做到这一点?
Class_age
20-22
20-22
20-22
23-25
23-25
23-25
23-25
23-25
20-22
20-22
这在每个组内的最小值和最大值之间均匀采样,返回与原始数据帧相同数量的值:
df = read.table(file='clipboard', header=TRUE)
library(plyr)
ddply(df, .(Class_age), function(x) {
level = x$Class_age[1]
min_max = as.numeric(strsplit(as.character(level), '-')[[1]])
x$age = runif(nrow(x), min=min_max[1], max=min_max[2])
return(x)
})
示例输出:
Class_age age
1 20-22 21.08586
2 20-22 21.78266
3 20-22 21.11404
4 20-22 20.46550
5 20-22 21.01637
6 23-25 24.52937
7 23-25 24.71782
8 23-25 23.26885
9 23-25 23.69933
10 23-25 24.61314
我有 classes 中个人年龄的信息。我的目标是将此信息转换为连续变量 "Age",每个变量 class 内均等分布。我怎样才能在 R 中做到这一点?
Class_age
20-22
20-22
20-22
23-25
23-25
23-25
23-25
23-25
20-22
20-22
这在每个组内的最小值和最大值之间均匀采样,返回与原始数据帧相同数量的值:
df = read.table(file='clipboard', header=TRUE)
library(plyr)
ddply(df, .(Class_age), function(x) {
level = x$Class_age[1]
min_max = as.numeric(strsplit(as.character(level), '-')[[1]])
x$age = runif(nrow(x), min=min_max[1], max=min_max[2])
return(x)
})
示例输出:
Class_age age
1 20-22 21.08586
2 20-22 21.78266
3 20-22 21.11404
4 20-22 20.46550
5 20-22 21.01637
6 23-25 24.52937
7 23-25 24.71782
8 23-25 23.26885
9 23-25 23.69933
10 23-25 24.61314