返回不正确值的自定义函数 - 示例(冲突的向量名称)

Custom function returning incorrect value - example (conflicting vector names)

出于某种原因,我无法通过以下方式应用自定义函数时获得相同的值:

MSD_p<-function(values,letters){
                  a<-abs(apply(combn(values,2), 2, diff))
                  b<-combn(letters,2)
                  c<-data.frame(t(rbind(a,b)))
                  c$a<-as.numeric(c$a)
                  c<-c[order(c$a),]
                  c$unique <- !sapply(gsub(" ", "", paste(c$V2, c$V3)), function(x) any(str_count(x, letters)>1))
                  m_1<-mean(c(min(c[c$unique==TRUE,]$a),max(c[c$unique==FALSE,]$a)))
                  c$unique_lag_3 <- ifelse(lag(c$unique) != c$unique & 
                                           lag(lag(c$unique)) != c$unique &
                                           lead(c$unique) == c$unique , "New", "Same")
                  rows <- lapply(which(c$unique_lag_3=="New"), function(x) (x-1):(x))
                  m_2<-mean(c[unlist(rows),]$a)
                  m_2<-as.numeric(m_2)
                  return(m_2)
}

MSD_p(dt3$values,dt3$letters)

结果为 8.5。

对比

                  a<-abs(apply(combn(dt3$values,2), 2, diff))
                  b<-combn(dt3$letters,2)
                  c<-data.frame(t(rbind(a,b)))
                  c$a<-as.numeric(c$a)
                  c<-c[order(c$a),]
                  c$unique <- !sapply(gsub(" ", "", paste(c$V2, c$V3)), function(x) any(str_count(x, letters)>1))
                  m_1<-mean(c(min(c[c$unique==TRUE,]$a),max(c[c$unique==FALSE,]$a)))
                  c$unique_lag_3 <- ifelse(lag(c$unique) != c$unique & 
                                           lag(lag(c$unique)) != c$unique &
                                           lead(c$unique) == c$unique , "New", "Same")
                  rows <- lapply(which(c$unique_lag_3=="New"), function(x) (x-1):(x))
                  m_2<-mean(c[unlist(rows),]$a)
                  m_2<-as.numeric(m_2);m_2

结果为 9.75。

这怎么可能? 数据:

dt3<-data.frame(structure(list(trial_number = c(20L, 20L, 20L, 20L, 20L, 20L, 
20L, 20L, 20L, 20L, 20L, 20L, 20L, 20L, 20L, 20L, 20L, 20L, 20L, 
20L), values = c(74.7, 81.1, 80.1, 90.1, 98.9, 96.1, 93.5, 95, 
99.6, 93.3, 96.7, 92.7, 94.7, 92.1, 100.3, 97.4, 94.1, 97.3, 
97.1, 93.1), letters = c("g", "cd", "d", "bc", "ab", "ab", "ab", 
"ab", "ab", "ab", "ab", "ab", "ab", "ab", "a", "ab", "ab", "ab", 
"ab", "ab")), row.names = c(NA, -20L), class = c("tbl_df", "tbl", 
"data.frame")))

感谢帮助。

在外部函数代码中,OP使用letters,它是R中的内置向量,它不是来自'dt3'列'letters'

c$unique <- !sapply(gsub(" ", "", paste(c$V2, c$V3)), 
       function(x) any(str_count(x, letters)>1))

应该是dt3$letters

此外,使用函数名称 (c) 或 letters(内置向量)创建对象名称可能会导致错误情况


由于 OP 在代码中命名内置结构,一个选项是使用 dt3$letters 代替 letters 或者只是为了重现输出,将上面的行更改为

c$unique <- !sapply(gsub(" ", "", paste(c$V2, c$V3)), 
       function(x) any(str_count(x, dt3$letters)>1))

运行代码给出

m_2
[1] 8.5