R/数据清理/user-friendly引用表的构建
R / data cleaning / user-friendly construction of reference tables
假设我有一个阶乘变量 x.fine
,它对于分析来说太细了(级别太多),我想通过创建参考 table 翻译 x.fine
到一个新变量 x.coarse
(我还没有开发)。
我可以打开 Excel 或 OpenRefine 并开始以交互方式创建查找值,将 table 导出为 CSV 并导入以加入 R。因为我必须创建 table 只需一次,将包含在分析中,保证可重复性。
但是有没有一种简单的方法可以在不离开 R/RStudio 的情况下创建这样的引用 table?
编辑:更改标题(将 "interactive" 替换为 "user-friendly")
也许library(hash)
?
library(hash)
x.fine <- c("a", "b", "c", "d", "e")
h <- hash(a = "X", b = "X", c = "Y", d = "Y", e = "Z")
x.coarse <- values(h[x.fine])
函数 questionr::irec
打开一个闪亮的应用程序,其中包含变量原始值和用于输入新值的字段。它在退出时将完整代码复制到控制台。
questionr::irec(mydf,"x.fine")
假设我有一个阶乘变量 x.fine
,它对于分析来说太细了(级别太多),我想通过创建参考 table 翻译 x.fine
到一个新变量 x.coarse
(我还没有开发)。
我可以打开 Excel 或 OpenRefine 并开始以交互方式创建查找值,将 table 导出为 CSV 并导入以加入 R。因为我必须创建 table 只需一次,将包含在分析中,保证可重复性。
但是有没有一种简单的方法可以在不离开 R/RStudio 的情况下创建这样的引用 table?
编辑:更改标题(将 "interactive" 替换为 "user-friendly")
也许library(hash)
?
library(hash)
x.fine <- c("a", "b", "c", "d", "e")
h <- hash(a = "X", b = "X", c = "Y", d = "Y", e = "Z")
x.coarse <- values(h[x.fine])
函数 questionr::irec
打开一个闪亮的应用程序,其中包含变量原始值和用于输入新值的字段。它在退出时将完整代码复制到控制台。
questionr::irec(mydf,"x.fine")