R循环直到条件匹配,然后继续
R loop until condition matched, then go on
我有一个数据框,其中一行包含数值。现在我想计算这些行的总和,直到 >= 1。
如果达到这一点 -> 为所有这些行打印一个计数器,在每一行中写入其计数器的 cumsum,然后查找下一行的 cumsum。
应该看起来像这样:
value counter cumsum
0.3 1 0.9
0.3 1 0.9
0.3 1 0.9
0.3 2 0.4
0.1 2 0.4
2 3 2
我的问题是如果 >= than 1,如何告诉 R 停止 cumsum。有什么想法吗?
提前谢谢你。
我不知道我是否正确理解了你的问题,但也许这里有帮助:
value = round(runif(20, min = 0.1, max = 0.5), 1)
csumVec = numeric(length(value))
counterVec = numeric(length(value))
startIndex = 1
csum = 0
counter = 1
for(i in 1:length(value)) {
csum = csum + value[i]
if(csum > 1) {
counterVec[startIndex:i] = counter
csumVec[startIndex:i] = csum-value[i]
startIndex = i
counter = counter+1
csum = value[i]
}
if(i == length(value)) {
counterVec[startIndex:i] = counter
csumVec[startIndex:i] = csum
}
}
cbind(value, counterVec, csumVec)
好像可以算出累计和,除以1,取floor()
(向下取整)
floor(cumsum(value) / 1)
## [1] 0 0 0 1 1 3
这是正确的,除了它是从 0 开始的并且 counter
不会递增 1。通过将上面的结果与其唯一值匹配来解决这些问题
counter0 = floor(cumsum(value) / 1)
counter = match(counter0, unique(counter0))
counter
## [1] 1 1 1 2 2 3
得到 'tricky' 部分后,我将使用 dplyr (library(dplyr)
) 完成其余部分
## library(dplyr)
tibble(value, counter) |>
mutate(cum_sum = cumsum(value)) |>
group_by(counter) |>
mutate(cumsum = max(cumsum(value)))
## # A tibble: 6 × 3
## # Groups: counter [3]
## value counter cumsum
## <dbl> <int> <dbl>
## 1 0.3 1 0.9
## 2 0.3 1 0.9
## 3 0.3 1 0.9
## 4 0.3 2 0.4
## 5 0.1 2 0.4
## 6 2 3 2
或者可能捕获(更一般的)函数中的棘手部分
cumgroup <- function(x, upper = 1) {
counter0 = floor(cumsum(x) / upper)
match(counter0, unique(counter0))
}
并纳入 dplyr 解决方案
tibble(value) |>
mutate(counter = cumgroup(value)) |>
group_by(counter) |>
mutate(cumsum = max(cumsum(value)))
或者取决于你想要什么
tibble(value) |>
mutate(
cumsum = cumsum(value) %% 1,
counter = cumgroup(value)
) |>
group_by(counter) |>
mutate(cumsum = max(cumsum)) |>
select(value, counter, cumsum)
我有一个数据框,其中一行包含数值。现在我想计算这些行的总和,直到 >= 1。 如果达到这一点 -> 为所有这些行打印一个计数器,在每一行中写入其计数器的 cumsum,然后查找下一行的 cumsum。
应该看起来像这样:
value counter cumsum
0.3 1 0.9
0.3 1 0.9
0.3 1 0.9
0.3 2 0.4
0.1 2 0.4
2 3 2
我的问题是如果 >= than 1,如何告诉 R 停止 cumsum。有什么想法吗? 提前谢谢你。
我不知道我是否正确理解了你的问题,但也许这里有帮助:
value = round(runif(20, min = 0.1, max = 0.5), 1)
csumVec = numeric(length(value))
counterVec = numeric(length(value))
startIndex = 1
csum = 0
counter = 1
for(i in 1:length(value)) {
csum = csum + value[i]
if(csum > 1) {
counterVec[startIndex:i] = counter
csumVec[startIndex:i] = csum-value[i]
startIndex = i
counter = counter+1
csum = value[i]
}
if(i == length(value)) {
counterVec[startIndex:i] = counter
csumVec[startIndex:i] = csum
}
}
cbind(value, counterVec, csumVec)
好像可以算出累计和,除以1,取floor()
(向下取整)
floor(cumsum(value) / 1)
## [1] 0 0 0 1 1 3
这是正确的,除了它是从 0 开始的并且 counter
不会递增 1。通过将上面的结果与其唯一值匹配来解决这些问题
counter0 = floor(cumsum(value) / 1)
counter = match(counter0, unique(counter0))
counter
## [1] 1 1 1 2 2 3
得到 'tricky' 部分后,我将使用 dplyr (library(dplyr)
) 完成其余部分
## library(dplyr)
tibble(value, counter) |>
mutate(cum_sum = cumsum(value)) |>
group_by(counter) |>
mutate(cumsum = max(cumsum(value)))
## # A tibble: 6 × 3
## # Groups: counter [3]
## value counter cumsum
## <dbl> <int> <dbl>
## 1 0.3 1 0.9
## 2 0.3 1 0.9
## 3 0.3 1 0.9
## 4 0.3 2 0.4
## 5 0.1 2 0.4
## 6 2 3 2
或者可能捕获(更一般的)函数中的棘手部分
cumgroup <- function(x, upper = 1) {
counter0 = floor(cumsum(x) / upper)
match(counter0, unique(counter0))
}
并纳入 dplyr 解决方案
tibble(value) |>
mutate(counter = cumgroup(value)) |>
group_by(counter) |>
mutate(cumsum = max(cumsum(value)))
或者取决于你想要什么
tibble(value) |>
mutate(
cumsum = cumsum(value) %% 1,
counter = cumgroup(value)
) |>
group_by(counter) |>
mutate(cumsum = max(cumsum)) |>
select(value, counter, cumsum)