生成具有总和约束的排列

Question

我有 n 组可变长度，并希望从每组中获取总和在特定范围内的项目的所有排列。例如在 R 中我们可以这样做：

set1 <- c(10, 15, 20)
set2 <- c(8, 9)
set3 <- c(1, 2, 3, 4)

permutations <- expand.grid(set1, set2, set3)
permutations$sum <- rowSums(permutations)
final <- permutations[permutations$sum >= 25 & permutations$sum <= 29, ]

# final:
#    Var1 Var2 Var3 sum
# 3    20    8    1  29
# 5    15    9    1  25
# 8    15    8    2  25
# 11   15    9    2  26
# 14   15    8    3  26
# 17   15    9    3  27
# 20   15    8    4  27
# 23   15    9    4  28

这对于少量的集合来说很好，但是随着集合的数量越来越多，会很快（按阶乘）增长。

是否可以生成符合约束的排列，而无需计算所有可能性？

在这个例子中，没有包含来自 set1 的 10 的最终组合，因为无论选择哪个其他数字，结果总和都太小。这可能有助于缩小问题的范围。例如，如果我知道 min(set1) + max(set2) + max(set3) < 25 == TRUE，那么我可以确保不在任何排列中包含 min(set1)。

我如何概括这一点，并使用约束来防止生成无效排列？

Answer 1

我认为您要求的是特定于鞋拔的，不太可能 "easy to implement"（有效）。另一种看待它的方法是在运行实验时进行调节（假设这是试验设计）。

我写了一个 lazyExpandGrid.R 在概念上类似于惰性 expand.grid，这意味着它不会预先评估所有可能的组合。如果需要，可以稍后在此答案中插入代码，但 github-gist 相当可靠（而且不短）。

使用它，你应该可以做到：

set1 <- c(10, 15, 20)
set2 <- c(8, 9)
set3 <- c(1, 2, 3, 4)

iter <- lazyExpandGrid(set1, set2, set3)

while (is.data.frame(item <- iter$nextItem())) {
  p <- sum(item)
  if (p < 25 || 29 < p) next
  print(item) # but really, do something more interesting here
}
#   Var1 Var2 Var3
# 3   20    8    1
#   Var1 Var2 Var3
# 5   15    9    1
#   Var1 Var2 Var3
# 8   15    8    2
#    Var1 Var2 Var3
# 11   15    9    2
#    Var1 Var2 Var3
# 14   15    8    3
#    Var1 Var2 Var3
# 17   15    9    3
#    Var1 Var2 Var3
# 20   15    8    4
#    Var1 Var2 Var3
# 23   15    9    4

注意买者：该功能大部分可用，但肯定有改进的方法。例如，使用 is.data.frame(item <- iter$nextItem()) 实际上是一个 isTruthy 测试（名称来自 shiny）；目前它 returns 1 行 data.frame 直到什么都没有，然后 returns FALSE。正如我现在所看到的，这肯定可以得到改善，我只是没有必要。如果您有任何想法、错误等，请随时在 github 要点页面上发表评论。

生成具有总和约束的排列

Generating permutations with a sum constraint

r

permutation

combinatorics