在 sqldf 语句中应用 CASE WHEN 来操作多列
Apply CASE WHEN in sqldf statement for manipulating multiple columns
我有一个包含 37 列的数据框 datwe
。我有兴趣将第 23 列到第 35 列中的整数值(1、2、99)转换为字符值('Yes'、'No'、'NA')。
datwe$COL23 <- sqldf("SELECT CASE COL23 WHEN 1 THEN 'Yes'
WHEN 2 THEN 'No'
WHEN 99 THEN 'NA'
ELSE 'Name ittt'
END as newCol
FROM datwe")$newCol
我一直在使用上面的sqldf
语句分别转换每一列。我想知道是否还有其他聪明的方法可以做到这一点,也许是应用功能?
如果您需要任何可重现的数据来构建数据框 datwe
,我将在此处添加。谢谢。
编辑:
示例 datwe
set.seed(12)
data.frame(replicate(37,sample(c(1,2,99),10,rep=TRUE)))
不确定你为什么使用 sqldf
,请看这个例子:
#dummy data
set.seed(12)
datwe <- data.frame(replicate(37,sample(c(1,2,99),10,rep=TRUE)))
#convert to Yes/No
res <- as.data.frame(
sapply(datwe[,23:37], function(i)
ifelse(i==1, "Yes",
ifelse(i==2, "No",
ifelse(i==99,NA,"Name itttt")))))
#update dataframe
datwe <- cbind(datwe[, 1:22],res)
#output, just showing first 2 columns
datwe[,23:24]
# X23 X24
# 1 No Yes
# 2 Yes Yes
# 3 Yes No
# 4 No No
# 5 Yes No
# 6 Yes Yes
# 7 <NA> No
# 8 No No
# 9 Yes <NA>
#10 No <NA>
编辑:
在带有外部变量的 for 循环中使用 sqldf
:
library(sqldf)
#dummy data
set.seed(12)
datwe <- data.frame(replicate(37,sample(c(1,2,99),10,rep=TRUE)))
#sqldf within a loop
for(myCol in paste0("X",23:37))
datwe[,myCol] <-
fn$sqldf("SELECT CASE $myCol
WHEN 1 THEN 'Yes'
WHEN 2 THEN 'No'
WHEN 99 THEN 'NA'
ELSE 'Name ittt'
END as newCol
FROM datwe")$newCol
#check output, showing only 2 columns
datwe[,23:24]
# X23 X24
# 1 No Yes
# 2 Yes Yes
# 3 Yes No
# 4 No No
# 5 Yes No
# 6 Yes Yes
# 7 NA No
# 8 No No
# 9 Yes NA
# 10 No NA
我有一个包含 37 列的数据框 datwe
。我有兴趣将第 23 列到第 35 列中的整数值(1、2、99)转换为字符值('Yes'、'No'、'NA')。
datwe$COL23 <- sqldf("SELECT CASE COL23 WHEN 1 THEN 'Yes'
WHEN 2 THEN 'No'
WHEN 99 THEN 'NA'
ELSE 'Name ittt'
END as newCol
FROM datwe")$newCol
我一直在使用上面的sqldf
语句分别转换每一列。我想知道是否还有其他聪明的方法可以做到这一点,也许是应用功能?
如果您需要任何可重现的数据来构建数据框 datwe
,我将在此处添加。谢谢。
编辑:
示例 datwe
set.seed(12)
data.frame(replicate(37,sample(c(1,2,99),10,rep=TRUE)))
不确定你为什么使用 sqldf
,请看这个例子:
#dummy data
set.seed(12)
datwe <- data.frame(replicate(37,sample(c(1,2,99),10,rep=TRUE)))
#convert to Yes/No
res <- as.data.frame(
sapply(datwe[,23:37], function(i)
ifelse(i==1, "Yes",
ifelse(i==2, "No",
ifelse(i==99,NA,"Name itttt")))))
#update dataframe
datwe <- cbind(datwe[, 1:22],res)
#output, just showing first 2 columns
datwe[,23:24]
# X23 X24
# 1 No Yes
# 2 Yes Yes
# 3 Yes No
# 4 No No
# 5 Yes No
# 6 Yes Yes
# 7 <NA> No
# 8 No No
# 9 Yes <NA>
#10 No <NA>
编辑:
在带有外部变量的 for 循环中使用 sqldf
:
library(sqldf)
#dummy data
set.seed(12)
datwe <- data.frame(replicate(37,sample(c(1,2,99),10,rep=TRUE)))
#sqldf within a loop
for(myCol in paste0("X",23:37))
datwe[,myCol] <-
fn$sqldf("SELECT CASE $myCol
WHEN 1 THEN 'Yes'
WHEN 2 THEN 'No'
WHEN 99 THEN 'NA'
ELSE 'Name ittt'
END as newCol
FROM datwe")$newCol
#check output, showing only 2 columns
datwe[,23:24]
# X23 X24
# 1 No Yes
# 2 Yes Yes
# 3 Yes No
# 4 No No
# 5 Yes No
# 6 Yes Yes
# 7 NA No
# 8 No No
# 9 Yes NA
# 10 No NA