虚拟变量取决于 df$id 列的字符长度

Dummy-variable depending on character lengths of df$id column

我正在尝试在 r 中创建一个 id 虚拟对象。情况有点棘手。如果 id 的长度 = 15,我想设置 id1=1,如果长度 =11,我想设置 0(这是仅有的两种情况)。 我尝试了以下代码:

id1 <- ifelse(nchar(as.character(data$id) == "15"), 1,0)

代码可以 运行 但是当我查看数据时,我发现生成的所有值都是 1 而不是 0,1。换句话说,我怀疑ifelse函数的设置有问题。

我也试过这个:

id1 <- factor(ifelse(nchar(as.character(data$id) == "15"), 1,0))

还是一样的结果。

谁能帮我解决这个问题?

数据是这样的:

id
799679d656c
032a71ce6132f38
b89602494f78508
c817fdde8fd
74e69d6b574
37d4c1ad5e56d06
63d89a0171f
c8bdb87cd537472
bdc09ee5421b1ec
967f47694e6
e4d825005b1
0eb6b851bba
9b27fa6949aaa42
bc82516f141
c4c7f10be01
cb90e05f8a4
cb45e5a890e
a93f57b965d78eb
5e3bb4f29457d75
62aa2cb20a30e07
33e8f2cd8bd
fdecbac8b827917
b51ea777c53d720

没有明确的 ifelse 声明:

id1 <- (nchar(as.character(data$id)) == 15)+0L

之所以可行,是因为由于 R 代码的简洁性,比较运算符 == 无需使用 if 或 else 即可测试两侧是否相等。 if 语句隐含在测试中,将一个可能冗长的编程任务替换为一个在 R 中简洁执行的任务。(归功于@DavidArenburg 零加法)

用户 20650 的评论中提到的对代码的直接修复:

id1 <- ifelse(nchar(as.character(data$id)) == 15, 1,0)

结果

id1
 #[1] 0 1 1 0 0 1 0 1 1 0 0 0 1 0 0 0 0 1 1 1 0 1 1