R - 使用函数更好地组织程序工作流程和流程

R - Better organize program workflow and processes using functions

我正在做一个数据挖掘项目,目前由几个脚本组成。

我想做的是通过函数更好的组织每个脚本中执行的流程

下面是众多示例之一:
在专门用于聚类的脚本中,我为异常值应用了一个过滤器

library(dplyr)

myDF <-
        myDF %>%
        filter(distance > 680) %>%
        filter(time > 120) %>% 
        filter(speed > 5)

我要找的是"wrapping"这个过程里面的可能性很小"node"。在我看来,R 中最接近 Enterprise Miner 节点的是函数。因此:

outlier_filter <- function() {   
            myDF %>%
            filter(distance > 680) %>%
            filter(time > 120) %>% 
            filter(speed > 5)
}

然而,当我运行:

outlier_filter 

它只是在控制台上打印代码。相反,我希望它像节点一样应用来过滤 DF 中的异常值。

我对其他建议持开放态度,但是,要点是通过简单地执行一项工作,我希望它能将其效果应用到我正在处理的数据框中。
另一个示例可能是 "node"/函数 create_features,它在 运行 时执行代码以将新变量添加到我的数据框中。

希望我说清楚了,谢谢。

您只是在打印函数,您可能想使用 outlier_filter()

来调用它

但是,这只能通过使用副作用来实现。通常这不是您想要的,解决方案可能是:

outlier_filter <- function(df) {   
  df %>%
    filter(distance > 680) %>%
    filter(time > 120) %>% 
    filter(speed > 5) %>%
    return()
}

您可以使用 myDF <- outlier_function(myDF)

调用函数