R - 使用函数更好地组织程序工作流程和流程
R - Better organize program workflow and processes using functions
我正在做一个数据挖掘项目,目前由几个脚本组成。
我想做的是通过函数更好的组织每个脚本中执行的流程
下面是众多示例之一:
在专门用于聚类的脚本中,我为异常值应用了一个过滤器
library(dplyr)
myDF <-
myDF %>%
filter(distance > 680) %>%
filter(time > 120) %>%
filter(speed > 5)
我要找的是"wrapping"这个过程里面的可能性很小"node"。在我看来,R 中最接近 Enterprise Miner 节点的是函数。因此:
outlier_filter <- function() {
myDF %>%
filter(distance > 680) %>%
filter(time > 120) %>%
filter(speed > 5)
}
然而,当我运行:
outlier_filter
它只是在控制台上打印代码。相反,我希望它像节点一样应用来过滤 DF 中的异常值。
我对其他建议持开放态度,但是,要点是通过简单地执行一项工作,我希望它能将其效果应用到我正在处理的数据框中。
另一个示例可能是 "node"/函数 create_features
,它在 运行 时执行代码以将新变量添加到我的数据框中。
希望我说清楚了,谢谢。
您只是在打印函数,您可能想使用 outlier_filter()
来调用它
但是,这只能通过使用副作用来实现。通常这不是您想要的,解决方案可能是:
outlier_filter <- function(df) {
df %>%
filter(distance > 680) %>%
filter(time > 120) %>%
filter(speed > 5) %>%
return()
}
您可以使用 myDF <- outlier_function(myDF)
调用函数
我正在做一个数据挖掘项目,目前由几个脚本组成。
我想做的是通过函数更好的组织每个脚本中执行的流程
下面是众多示例之一:
在专门用于聚类的脚本中,我为异常值应用了一个过滤器
library(dplyr)
myDF <-
myDF %>%
filter(distance > 680) %>%
filter(time > 120) %>%
filter(speed > 5)
我要找的是"wrapping"这个过程里面的可能性很小"node"。在我看来,R 中最接近 Enterprise Miner 节点的是函数。因此:
outlier_filter <- function() {
myDF %>%
filter(distance > 680) %>%
filter(time > 120) %>%
filter(speed > 5)
}
然而,当我运行:
outlier_filter
它只是在控制台上打印代码。相反,我希望它像节点一样应用来过滤 DF 中的异常值。
我对其他建议持开放态度,但是,要点是通过简单地执行一项工作,我希望它能将其效果应用到我正在处理的数据框中。
另一个示例可能是 "node"/函数 create_features
,它在 运行 时执行代码以将新变量添加到我的数据框中。
希望我说清楚了,谢谢。
您只是在打印函数,您可能想使用 outlier_filter()
但是,这只能通过使用副作用来实现。通常这不是您想要的,解决方案可能是:
outlier_filter <- function(df) {
df %>%
filter(distance > 680) %>%
filter(time > 120) %>%
filter(speed > 5) %>%
return()
}
您可以使用 myDF <- outlier_function(myDF)